英伟达被控主动联络安娜的档案以高速下载盗版书库

英伟达除了供应 AI 芯片外,还开发了自己的大模型,如 NeMo、Retro-48B、InstructRetro 和 Megatron。那么这些大模型的训练数据来自何处?图书作者指控英伟达使用盗版书库训练模型。上周五原告修改了诉状,指控英伟达使用了影子图书馆“安娜的档案(Anna’s Archive)”收集的盗版电子书库。诉状援引英伟达内部邮件和文件称,英伟达员工主动联系“安娜的档案”,询问该影子图书馆提供的付费“高速访问”是什么意思。安娜的档案要求英伟达管理层内部批准之后它才会提供该服务。英伟达据报道在一周内批准了这一要求,安娜的档案随后提供了 500 TB 电子书的高速访问。英伟达还被控从 LibGen、Sci-Hub 和 Z-Library 下载书籍。

上一篇:

下一篇:

已有 0 条评论