扎克伯格被聯合起訴 MetaAI訓練涉嫌侵權
Meta這次,可能真的惹到全球出版行業了,近期AI圈最危險的壹場戰爭來了。
5月6日,肆家主要出版商和壹名作者在曼哈頓聯邦法院起訴Meta,指控這家科技巨頭濫用他們的書籍和期刊文章來訓練其人工智能模型。
此次發起訴訟的機構與個人包括:聖智學習(Cengage Learning)、阿歇特出版(Hachette)、麥克米倫(Macmillan)、麥格勞(McGraw)以及作家Scott Turow 。他們在擬議的集體訴訟中聲稱,Meta從盜版網站獲取數百萬本圖書與期刊文章,並將這些版權內容用於訓練其AI大模型Llama。Meta還刻意抹除作品中的版權管理信息,隱瞞訓練數據來源,為未經授權的商用提供便利。
與以往針對Meta的AI版權訴訟不同,此案最引人注目的地方在於,訴狀將矛頭直接指向了扎克伯格本人。訴訟將Meta首席執行官馬克?扎克伯格列為被告,指控其親自批准並主動縱容此次版權侵權行為。出版商在訴狀中表示:“被告的行為,構成史上規模最大的版權作品侵權行為之壹。”
對於這壹指控,Meta方面否認有任何不當行為,稱將積極抗辯此次訴訟。Meta發言人表示:“AI正在為個人和公司驅動變革性的創新、生產力和創造力,且法院已正確裁定,利用受版權保護的材料訓練AI可以構成合理使用,我們將積極應對這起訴訟。”
截至目前,法院尚未對該案作出實質性裁決,案件仍在初步審理階段,但其走向無疑將對整個AI行業產生深遠影響。
此案的核心爭論焦點是AI訓練數據的合法性,以及Meta“合理使用”抗辯能否成立。
美國《版權法》規定了滿足“合理使用”的肆個條件,尤其會重點審查其中的兩個要素:壹是對原作品使用的性質或目的,贰是使用對享有版權作品的潛在市場或價值所產生的影響。
從過往案例看,AI公司如果使用圖書等訓練AI具有“高度轉換性”,即數據並非被用於閱讀,而是為了訓練AI完成任務,其功能與原作用途截然不同;從影響上看,AI沒有直接替代圖書市場。那麼法院就會支持AI訓練屬於合理使用。
最終,若法院判定Meta侵權,將直接抬高AI公司訓練數據的合規成本,倒逼科技巨頭放棄盜版數據,轉向合法授權模式。若Meta勝訴,則會進壹步擴大數據合理使用的范圍,沖擊內容創作生態。
過去叁年,全球范圍內AI訓練數據版權訴訟密集爆發。
2025年6月,美國加州(专题)北區聯邦法院曾駁回13位作家對Meta的版權訴訟,認定其Llama模型訓練構成“合理使用”。但法官明確指出該判決僅適用於該案特定情形,不構成行業通用准則。同年,Anthropic公司因類似指控,與作家群體達成15億美元和解,為每部盜版作品支付約3000美元,成為行業首個大規模和解案例。
2025年11月,德國慕尼黑第壹地區法院判決OpenAI侵犯德國音樂版權協會(GEMA)權益,成為“歐洲生成式AI版權第壹案”,明確AI模型長期存儲版權內容超出“文本與數據挖掘例外”范圍。此外,《紐約(专题)時報》起訴OpenAI、Getty Images起訴Stability AI等案件,均圍繞AI訓練數據版權展開。
我國2023年發布的《生成式人工智能服務管理暫行辦法》明確規定,生成式AI服務提供者“應當使用具有合法來源的數據”,不得侵害他人知識產權。中央網信辦部署開展“清朗·整治AI應用亂象”專項行動,明確將“訓練數據來源合規性存在的問題”作為整治重點。
當前,AI行業正處於關鍵的制度塑造窗口期。AI到底能不能直接學習有版權保護的內容?如果內容可以被AI大規模學習,那麼AI時代的規則,到底如何制定?
[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句
5月6日,肆家主要出版商和壹名作者在曼哈頓聯邦法院起訴Meta,指控這家科技巨頭濫用他們的書籍和期刊文章來訓練其人工智能模型。
此次發起訴訟的機構與個人包括:聖智學習(Cengage Learning)、阿歇特出版(Hachette)、麥克米倫(Macmillan)、麥格勞(McGraw)以及作家Scott Turow 。他們在擬議的集體訴訟中聲稱,Meta從盜版網站獲取數百萬本圖書與期刊文章,並將這些版權內容用於訓練其AI大模型Llama。Meta還刻意抹除作品中的版權管理信息,隱瞞訓練數據來源,為未經授權的商用提供便利。
與以往針對Meta的AI版權訴訟不同,此案最引人注目的地方在於,訴狀將矛頭直接指向了扎克伯格本人。訴訟將Meta首席執行官馬克?扎克伯格列為被告,指控其親自批准並主動縱容此次版權侵權行為。出版商在訴狀中表示:“被告的行為,構成史上規模最大的版權作品侵權行為之壹。”
對於這壹指控,Meta方面否認有任何不當行為,稱將積極抗辯此次訴訟。Meta發言人表示:“AI正在為個人和公司驅動變革性的創新、生產力和創造力,且法院已正確裁定,利用受版權保護的材料訓練AI可以構成合理使用,我們將積極應對這起訴訟。”
截至目前,法院尚未對該案作出實質性裁決,案件仍在初步審理階段,但其走向無疑將對整個AI行業產生深遠影響。
此案的核心爭論焦點是AI訓練數據的合法性,以及Meta“合理使用”抗辯能否成立。
美國《版權法》規定了滿足“合理使用”的肆個條件,尤其會重點審查其中的兩個要素:壹是對原作品使用的性質或目的,贰是使用對享有版權作品的潛在市場或價值所產生的影響。
從過往案例看,AI公司如果使用圖書等訓練AI具有“高度轉換性”,即數據並非被用於閱讀,而是為了訓練AI完成任務,其功能與原作用途截然不同;從影響上看,AI沒有直接替代圖書市場。那麼法院就會支持AI訓練屬於合理使用。
最終,若法院判定Meta侵權,將直接抬高AI公司訓練數據的合規成本,倒逼科技巨頭放棄盜版數據,轉向合法授權模式。若Meta勝訴,則會進壹步擴大數據合理使用的范圍,沖擊內容創作生態。
過去叁年,全球范圍內AI訓練數據版權訴訟密集爆發。
2025年6月,美國加州(专题)北區聯邦法院曾駁回13位作家對Meta的版權訴訟,認定其Llama模型訓練構成“合理使用”。但法官明確指出該判決僅適用於該案特定情形,不構成行業通用准則。同年,Anthropic公司因類似指控,與作家群體達成15億美元和解,為每部盜版作品支付約3000美元,成為行業首個大規模和解案例。
2025年11月,德國慕尼黑第壹地區法院判決OpenAI侵犯德國音樂版權協會(GEMA)權益,成為“歐洲生成式AI版權第壹案”,明確AI模型長期存儲版權內容超出“文本與數據挖掘例外”范圍。此外,《紐約(专题)時報》起訴OpenAI、Getty Images起訴Stability AI等案件,均圍繞AI訓練數據版權展開。
我國2023年發布的《生成式人工智能服務管理暫行辦法》明確規定,生成式AI服務提供者“應當使用具有合法來源的數據”,不得侵害他人知識產權。中央網信辦部署開展“清朗·整治AI應用亂象”專項行動,明確將“訓練數據來源合規性存在的問題”作為整治重點。
當前,AI行業正處於關鍵的制度塑造窗口期。AI到底能不能直接學習有版權保護的內容?如果內容可以被AI大規模學習,那麼AI時代的規則,到底如何制定?
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: |
| 延伸閱讀 |
MetaAI巨震!成批華人科學家失業 這大神也在內 |
華裔電腦天才、對中鷹派?MetaAI實驗室新掌門 |
推薦:



