Meta被曝助推數(shù)字盜版:30%訓(xùn)練AI書籍遭二次傳播快訊
的盜版書籍訓(xùn)練 AI 模型外,不過最新研究指出的二次上傳行為可能顛覆這一論點,中下載了 82TB 的盜版版權(quán)資料用于訓(xùn)練其 LLaMA 人工智能模型。
3 月 27 日消息,科技媒體 WinBuzzer 昨日(3 月 26 日)發(fā)布博文,報道稱最新研究顯示,Meta 在數(shù)字圖書盜版鏈中的參與度遠(yuǎn)超預(yù)期。
消息稱 Meta 公司使用 LibGen、Z-Library 等“影子圖書館”的盜版書籍訓(xùn)練 AI 模型外,還通過 BitTorrent 重新上傳約 30% 的已下載書籍,客觀上延長了盜版作品的傳播周期。
專家指出,盡管 BitTorrent 默認(rèn)會分片上傳數(shù)據(jù),但 Meta 的上傳量異常偏高,涉嫌變相成為盜版網(wǎng)絡(luò)節(jié)點。
曾于今年 2 月報道,Meta 在法庭文件中聲稱,盡管其從“影子圖書館”中下載了 82TB 的盜版版權(quán)資料用于訓(xùn)練其 LLaMA 人工智能模型,但公司員工已采取措施,確保在下載過程中未對任何文件進行“種子分享(seeding)”。
不過最新研究指出的二次上傳行為可能顛覆這一論點,澳大利亞前總理馬爾科姆?特恩布爾發(fā)現(xiàn)著作被盜用,斥其“極度不安”,美國普利策獎得主邁克爾?夏邦等已提起訴訟,法國出版商指控 Meta 的行為是“對版權(quán)作品的大規(guī)模掠奪”。
歐盟委員會已關(guān)注此事,可能依據(jù)《歐盟 AI 法案》嚴(yán)懲。若法院最終認(rèn)定 Meta 需為訓(xùn)練數(shù)據(jù)獲取正式授權(quán),將重塑 AI 行業(yè)數(shù)據(jù)獲取規(guī)則。目前案件走向尚未明朗,但這場版權(quán)爭議注定成為數(shù)字時代知識產(chǎn)權(quán)保護的標(biāo)桿性事件。(故淵)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。