[潜规则] 英伟达被起诉,用盗版训练AI成行业潜规则?

Library Genesis被称为“影子图书馆”的鼻祖。2017年,美国纽约法院判决Library Genesis赔偿出版商爱思唯尔1500万美元。2023年,多家美国教科书出版商再次起诉 LibGen,要求其移交域名或将其从互联网上彻底抹除。


Sci-Hub 专注学术论文,目前英国法国德国等国家的法院已下令所有主要互联网供应商(ISP)封锁 Sci-Hub。Sci-Hub 自 2020年底起已基本停止大规模上传新论文。

2024年2月,在与Anna’s Archive达成合作四个月后,英伟达发布了当时旗下最强大的大模型Nemotron-4 15B。公开资料显示,Nemotron-4 15B拥有150亿参数,使用了8万亿文本标注数据进行预训练。英伟达方面并未披露该大模型的训练数据来源,不过曾公开表示该模型训练数据中70%来自“英语自然语言”数据集,该数据集本身包含4.6%的图书内容。起诉书认为,据此推算,英伟达的训练数据需包含数百万册图书。除非使用了盗版资源,否则该公司不可能获得足量的图书数据。

此外,起诉书显示,通过NeMo Megatron框架和BigNLP平台,英伟达向客户提供了自动下载并预处理The Pile数据集的脚本。英伟达还向客户Persimmon AI Labs和亚马逊提供了类似的下载和处理The Pile数据集的协助。



“影子图书馆”非法存储并传播海量图书资源,愿意提供付费的“优先级下载通道”,虽满足了大模型开发者对优质数据的需求,但带来了极大的侵权风险;针对诉讼,英伟达提交了正式动议,主张其行为属于“合理使用”

大模型训练需求撑起了盗版生意?

“影子图书馆”非法存储并传播大量高质量版权内容,也愿意为大模型开发者提供付费的“优先级下载通道”。

Anna's Archive在其官网表示,“大语言模型依赖高质量数据才能蓬勃发展。我们拥有全球规模最大的图书、论文、期刊等资源,这些正是最高质量的文本资源。我们提供高速的企业级访问权限,以换取数万美元级别的捐赠。”

这一商业模式也为“影子图书馆”争取了一线生机。Anna's Archive在官网表示,不久前,“影子图书馆”濒临消亡。因诉讼压力,收录大量学术论文盗版资源的Sci-Hub已停止接收新作品。“随着人工智能崛起,几乎所有开发大语言模型的企业都联系我们获取数据训练。我们已为约30家公司提供高速访问权限。”


但使用盗版图书资源为大模型公司带来极大的侵权诉讼风险。美国版权局2025年5月发布的《版权与人工智能》系列报告指出,数据收集和预处理阶段涉及下载、转换和修改大量受版权保护的作品,无论数据来源是否为公开网站,均可能构成对复制权、编辑权、改编权的多重侵害,在商业用途情形下风险尤为突出。

2025年,美国法院对两起版权人起诉大模型公司使用盗版图书资源的案件作出判决。

2025年6月23日,美国北加利福尼亚地区法院就Andrea Bartz等作家起诉Anthropic的版权侵权诉讼案作出关于合理使用的裁决,认定使用受版权保护的作品进行人工智能训练属于合理使用。不过,从Library Genesis和Pirate Library Mirror等网站下载超过700万本“明知是盗版”的电子版图书的行为,则“本质上、不可救药地构成侵权”,无法被合理使用原则所豁免。同年9月,有媒体报道称,Anthropic已同意支付至少15亿美元达成该案的和解协议。美国加州一家法院已初步批准了这一协议。这也将成为历史上有公开报道的最大规模版权赔偿案。

2025年6月25日,同样是美国北加利福尼亚地区法院就Richard Kadrey等作家起诉Meta Platforms使用盗版图书训练大模型Llama构成版权侵权案作出简易裁决,判决同样认定Meta的行为构成合理使用。不过,法院判定Meta获取并使用盗版作品的行为不单独构成侵权,因为Meta将该等作品用于AI大模型训练目的,此种使用属于转换性用途。

[物价飞涨的时候 这样省钱购物很爽]
还没人说话啊,我想来说几句
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读 更多...
    值得一看,常见的社会潜规则有哪些? 30万亿帝国接班局:黄仁勋打破潜规则 叛逆二代上位
    她坚决拒绝潜规则,如今42岁却还单身 她怒撕潜规则 硬刚张国立章子怡 终被联合封杀
    坚决拒绝潜规则,47岁仍未婚的她如今怎样了? 沉默人升官 说话人危险 政治局会议潜规则
    "不交社保"潜规则被打破,快餐茶饮的缴纳现状如何  (1条评论) 青春期孩子的潜规则:是盲目从众还是奢侈浪费
    微信最新潜规则:你发的每条朋友圈 都在出卖你 中国国企第一贪被判死缓 爆多名男星潜规则献身
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)

    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站