英伟达涉版权侵权诉讼，被指从影子图书馆获取 500TB 盗版数据

发布时间: 2026-01-22 09:11:43 来源：环球网

观看：63

1月21日消息，据AlBase报道，芯片巨头英伟达近日陷入一场备受关注的版权集体诉讼。多位图书作者通过修订后的起诉状指控，英伟达为训练自主研发的人工智能模型，蓄意从“安娜档案馆”等多个“影子图书馆”获取海量盗版数据，涉案数据规模达500TB，包含数百万本受版权保护的图书，相关行为已涉嫌侵犯著作权。

作为人工智能热潮中的核心受益企业之一，英伟达凭借人工智能训练芯片及数据中心服务的市场需求，营收持续大幅增长。与此同时，该公司也在积极布局自主AI模型研发，推出了NeMo、Retro-48B等多款模型，这些模型的训练均依赖海量文本数据支撑。然而，其数据获取方式的合法性一直备受质疑。

早在2024年初，就有多位作者以侵犯版权为由将英伟达诉至法院，指控其AI模型使用包含盗版作品的Books3数据集进行训练。英伟达当时辩称相关行为属于“合理使用”，声称书籍对其AI模型而言仅为统计关联数据，但这一说法并未平息争议。随着诉讼推进，原告方在证据开示阶段发现了更多关键线索，并据此提交了修订后的起诉状，大幅扩大了诉讼范围。

新诉状援引英伟达内部邮件及文件显示，受市场竞争压力驱动，该公司数据战略团队成员曾主动联系“安娜档案馆”——这一目前规模较大且颇具争议的“影子图书馆”，寻求获取数百万份盗版资料，并探讨将其纳入大语言模型预训练数据的可行性。“安娜档案馆”明确告知英伟达其藏书均为非法获取和留存，并要求英伟达高管确认是否已获得内部授权推进合作。令人关注的是，英伟达管理层在知晓数据非法性的数天后，仍于一周内批准了相关合作，“安娜档案馆”随后向其开放了约500TB的盗版数据访问权限，其中包含的数百万本图书，原本多仅能通过“互联网档案馆”的数字借阅系统获取，而该档案馆自身也已身陷相关诉讼。

除“安娜档案馆”外，起诉状还指出英伟达存在多渠道获取盗版数据的行为，其不仅从“图书馆基因”（LibGen）、“科学枢纽”（Sci-Hub）、“Z图书馆”（Z-Library）等平台下载图书，还向企业客户分发脚本和工具，助力客户自动下载包含盗版Books3数据集的“The Pile”数据库。基于此，原告方新增了辅助侵权与共同侵权两项诉讼主张，认为英伟达通过为他人获取盗版数据集提供便利牟利。

据悉，这是美国大型科技公司与“安娜档案馆”的往来函件首次被公开披露。此前不久，“安娜档案馆”已丢失多个域名，此次与英伟达的侵权纠纷进一步提升了这家盗版图书馆的公众关注度。目前，诉状尚未明确提及英伟达是否向“安娜档案馆”支付了数据访问费用。（纯钧）

1月21日消息，据AlBase报道，芯片巨头英伟达近日陷入一场备受关注的版权集体诉讼。多位图书作者通过修订后的起诉状指控，英伟达为训练自主研发的人工智能模型，蓄意从“安娜档案馆”等多个“影子图书馆”获取海量盗版数据，涉案数据规模达500TB，包含数百万本受版权保护的图书，相关行为已涉嫌侵犯著作权。

作为人工智能热潮中的核心受益企业之一，英伟达凭借人工智能训练芯片及数据中心服务的市场需求，营收持续大幅增长。与此同时，该公司也在积极布局自主AI模型研发，推出了NeMo、Retro-48B等多款模型，这些模型的训练均依赖海量文本数据支撑。然而，其数据获取方式的合法性一直备受质疑。

早在2024年初，就有多位作者以侵犯版权为由将英伟达诉至法院，指控其AI模型使用包含盗版作品的Books3数据集进行训练。英伟达当时辩称相关行为属于“合理使用”，声称书籍对其AI模型而言仅为统计关联数据，但这一说法并未平息争议。随着诉讼推进，原告方在证据开示阶段发现了更多关键线索，并据此提交了修订后的起诉状，大幅扩大了诉讼范围。

新诉状援引英伟达内部邮件及文件显示，受市场竞争压力驱动，该公司数据战略团队成员曾主动联系“安娜档案馆”——这一目前规模较大且颇具争议的“影子图书馆”，寻求获取数百万份盗版资料，并探讨将其纳入大语言模型预训练数据的可行性。“安娜档案馆”明确告知英伟达其藏书均为非法获取和留存，并要求英伟达高管确认是否已获得内部授权推进合作。令人关注的是，英伟达管理层在知晓数据非法性的数天后，仍于一周内批准了相关合作，“安娜档案馆”随后向其开放了约500TB的盗版数据访问权限，其中包含的数百万本图书，原本多仅能通过“互联网档案馆”的数字借阅系统获取，而该档案馆自身也已身陷相关诉讼。

除“安娜档案馆”外，起诉状还指出英伟达存在多渠道获取盗版数据的行为，其不仅从“图书馆基因”（LibGen）、“科学枢纽”（Sci-Hub）、“Z图书馆”（Z-Library）等平台下载图书，还向企业客户分发脚本和工具，助力客户自动下载包含盗版Books3数据集的“The Pile”数据库。基于此，原告方新增了辅助侵权与共同侵权两项诉讼主张，认为英伟达通过为他人获取盗版数据集提供便利牟利。

据悉，这是美国大型科技公司与“安娜档案馆”的往来函件首次被公开披露。此前不久，“安娜档案馆”已丢失多个域名，此次与英伟达的侵权纠纷进一步提升了这家盗版图书馆的公众关注度。目前，诉状尚未明确提及英伟达是否向“安娜档案馆”支付了数据访问费用。（纯钧）

竹类植物是竹亚科植物的总称，与水稻、小麦、大麦和燕麦同属于禾本科BOP分支，具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功能研究，有效整理归纳盘活海量的竹类组学和分　　监管AI，欧盟出手，美国掉队？　　上个世纪，科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”，带来了对“机器人”与“规则”的美好幻想。　　如今，伴随着ChatGPT、Sora的爆火，人工智能(AI)领域的激烈竞争，对该领域的监管据英国《泰晤士报》网站3月15日报道，2020年1月，英国帝国理工学院的亚当·汉普希尔与英国广播公司合作，对8万人进行了30分钟的测试，目的是揭示生活方式的改变会影响我们的大脑功能。三个月据埃菲社报道，多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近，西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表明，这种新疗法比目前优先使用的免疫疗法更有记者3月21日从安徽农业大学获悉，该校生命科学学院韩毅教授课题组与国内外专家合作，发现了植物避盐性的关键基因。该研究对于提高植物耐盐性，帮助盐碱地下的农作物稳产具有重要理论指导意义。相 3月24日，记者从中国农业科学院获悉，该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队，开发了快速创制细胞质雄性不育系的新方法——“一步法”。相关研究日前发表在国际期刊《自然&midd 。

本文链接：英伟达涉版权侵权诉讼，被指从影子图书馆获取 500TB 盗版数据http://www.sushuapos.com/show-2-14980-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： AI赋能电商，如何叫好又叫座？

下一篇：我国已启动第二阶段6G技术试验

英伟达涉版权侵权诉讼，被指从影子图书馆获取 500TB 盗版数据

热门资讯

推荐资讯

科技最热文章