當前位置:首頁(yè) > 百科 > 正文內容

AI“剽竊”問(wèn)題難解,這家初創(chuàng )公司發(fā)明解決算法丨AI版權戰事

青浦區燈箱制作2個(gè)月前 (08-13)百科26
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

21世紀經(jīng)濟報道記者肖瀟 實(shí)習生韓佳序 北京報道

8月6日,一家初創(chuàng )公司ProRata.AI在加州成立,創(chuàng )始人是Bill Gross。這個(gè)名字不像其他硅谷大牛那樣耳熟能詳,但他發(fā)明的按點(diǎn)擊付費廣告、競價(jià)排名廣告每個(gè)人都很熟悉。搜索引擎巨頭的繁榮一定程度歸功于該商業(yè)模式,說(shuō)是互聯(lián)網(wǎng)經(jīng)濟的心肺功能也不為過(guò)。

現在Bill Gross提出了AI時(shí)代的商業(yè)模式:AI按使用收費(AI pay-per-use)。依靠一項專(zhuān)利算法,AI的輸出會(huì )被拆解成不同部分,找到相應的版權來(lái)源,并根據輸出比例分配收入。

盡管還沒(méi)有完全落地的產(chǎn)品,《金融時(shí)報》、《財富》、環(huán)球音樂(lè )集團等大型內容版權方已經(jīng)和ProRata簽署了合作協(xié)議。目前該公司獲得2500萬(wàn)美元的A輪融資。

按使用次數分成

ProRata的最大噱頭無(wú)疑是它的歸因算法。

Bill Gross這樣解釋?zhuān)骸拔姚倐兛梢园焉墒饺斯ぶ悄艿妮敵觥獰o(wú)論是文本、圖像、音樂(lè )還是電影,分解成各個(gè)組成部分,找出它們的來(lái)源,然后給每個(gè)版權持有者一個(gè)百分比的歸屬,以此給他們相應的報酬。”公司官網(wǎng)提到,這一歸因算法已經(jīng)申請了專(zhuān)利。

想法固然美好,但要如何落地推行?考慮到ProRata主要針對的是AI搜索應用,公司計劃在10月推出自己的AI搜索產(chǎn)品作為演示。據稱(chēng)該產(chǎn)品只會(huì )引用有明確授權的內容,將靠廣告和訂閱收費,50%的總收入與版權方分享。

實(shí)際上,《連線(xiàn)》雜志報道稱(chēng),Bill Gross的終極目標是吸引Open AI、Anthropic這樣的AI巨頭,把ProRata的技術(shù)糅合進(jìn)大模型,最終成為類(lèi)似Visa或 Master Card的支付零件。

021yin.com021yin.com公司自身過(guò)于依賴(lài)和大型搜索公司的合作,逐漸淪落為一個(gè)零部件供應商,最終在2003年被雅虎用16.3億美元收購。

從這次ProRata的產(chǎn)品構想來(lái)看,風(fēng)險無(wú)疑也是存在的:AI被稱(chēng)為“大力出奇跡”,如果沒(méi)有海量的互聯(lián)網(wǎng)數據支持,大模型的性能需要打上問(wèn)號。Bill Gross也意識到了這一點(diǎn)。

Bill Gross解釋?zhuān)?“我認為 7000 萬(wàn)份優(yōu)質(zhì)文檔實(shí)際上優(yōu)于 700 億份劣質(zhì)文檔,能帶來(lái)更好的答案。” 他希望ProRata能夠證明,數據質(zhì)量比數量更重要,并認為這樣可以抑制AI的幻覺(jué)。換句話(huà)說(shuō),相比其他AI搜索,ProRata將競爭力押注在大模型的準確性和可靠性上。

盡管產(chǎn)品還沒(méi)有被檢驗,ProRata已經(jīng)收到了熱情的市場(chǎng)反應。據公司官網(wǎng)信息,ProRata已與環(huán)球音樂(lè )集團、《金融時(shí)報》、《財富》、《大西洋月刊》、Axel Springer媒體集團、環(huán)球音樂(lè )集團合作;此外,該公司還與知名作家達成了合作協(xié)議,包括托尼·羅賓斯(Tony Robbins)、尼爾·波茲曼(Neal Postman)和斯科特·加洛韋(Scott Galloway);Bill Gross還稱(chēng),首次發(fā)布公司聲明后,自己收到了大量合作請求,《時(shí)代》雜志最新加進(jìn)了合作名單中。

激烈的戰火,不明晰的法律

“我們迫切需要一個(gè)協(xié)調AI和版權方的方案……內容有明確歸屬,創(chuàng )作者能獲得公平報酬,可以幫助建立一個(gè)更健康的生態(tài)。”《金融時(shí)報》CEO在ProRata的合作聲明中寫(xiě)道。

從這份聲明里可以感受到,內容行業(yè)對AI“剽竊”愈發(fā)不滿(mǎn),催生了對ProRata此類(lèi)公司的需求。

近幾年AI公司抓取數據當作訓練素材的做法,引起大量創(chuàng )作者抗議,由此帶來(lái)的版權訴訟不斷。今年6月,AI搜索也深陷這一漩渦——《福布斯》指控Perplexity幾乎能原封不動(dòng)地輸出自己的報道原文;美國付費媒體《連線(xiàn)》也發(fā)現了一樣的問(wèn)題。

之所以會(huì )被稱(chēng)為“剽竊”,有兩方面原因:

拿Perplexity的爭議為例。根據用戶(hù)的輸入詞,Perplexity會(huì )在互聯(lián)網(wǎng)中爬取相關(guān)結果,總結成答案輸出。有付費墻阻攔的網(wǎng)站和在代碼文件中禁止了robots.txt(爬蟲(chóng)抓?。┑木W(wǎng)站,通常是會(huì )被繞開(kāi)的。但如果用戶(hù)自己輸入了一個(gè)明確網(wǎng)址,Perplexity很可能會(huì )突破規則,強行滿(mǎn)足用戶(hù)的要求。

更深一層的原因則是,由于Perplexity可以直接概括內容,用戶(hù)可能不再需要點(diǎn)進(jìn)原網(wǎng)站閱讀。內容網(wǎng)站流量減少,但又無(wú)法從AI搜索這一渠道獲利,此般利益沖突難以調解。

AI搜索從網(wǎng)上爬取、引用數據,算不算侵犯版權,要不要給創(chuàng )作者補償?目前法律沒(méi)有給出明確答案。

日本、歐盟在內的部分國家規定了“文本與數據挖掘行為”屬于合理使用,也就是不算侵犯版權,這也是許多AI公司的底氣來(lái)源。但前段時(shí)間,法國競爭管理局回復谷歌,抓取數據能不能用來(lái)訓練AI“還不清楚”。

廣東財經(jīng)大學(xué)法學(xué)院教授姚志偉此前向21記者解釋?zhuān)?這是因為當初立法時(shí),文本與數據挖掘針對的是傳統的算法推薦,不是生成式AI,這兩種技術(shù)顯然不能簡(jiǎn)單畫(huà)上等號。

而我國《著(zhù)作權法》列舉的13種合理使用情形中,沒(méi)有包含數據挖掘行為。姚志偉補充道,我國在司法實(shí)踐中看重使用目的,會(huì )強調這一行為是否為商業(yè)使用、有沒(méi)有營(yíng)利性質(zhì)。這樣來(lái)看,挖掘數據來(lái)訓練大模型,在我國可能更難落入合理使用的范疇。

作為AI搜索的頭部應用,Perplexity的合規困境是整個(gè)AI行業(yè)的縮影。在硬性要求遲遲不來(lái)的情況下,依靠ProRata這樣更軟性的市場(chǎng)方案,也許是擺脫困境的一種方式。

值得一提的是,許多AI公司已經(jīng)啟動(dòng)了收入共享計劃,只是尚不清楚細節。8月1日,Perplexity首席商務(wù)官就在采訪(fǎng)中說(shuō),目前Perplexity已經(jīng)簽署了一批授權協(xié)議,同樣也是按照引用次數計算,沒(méi)有透露更具體的分成比例和計算方式。

更多內容請下載21財經(jīng)APP

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全