當前位置:首頁(yè) > 百科 > 正文內容

知名AI產(chǎn)品被控“抄襲”,反AI工具市場(chǎng)會(huì )成為一個(gè)新方向嗎?

邢臺彩頁(yè)印刷4個(gè)月前 (07-09)百科24
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

文丨揚帆出海周可

估值30億美元的Perplexity正在面臨一場(chǎng)關(guān)于抄襲指控的風(fēng)波。

不同于ChatGPT和Claude,AI聊天搜索引擎Perplexity并未訓練自身基礎模型,而是使用開(kāi)放或商業(yè)可用的模型來(lái)獲取相關(guān)信息,并轉化為答案。

誕生于2022年的Perplexity在如今的AI搜索領(lǐng)域也是炙手可熱的明星產(chǎn)品,不過(guò),在剛剛過(guò)去的6月份,《福布斯》指責Perplexity涉嫌抄襲其新聞文章,Perplexity還被其他媒體指責非法抓取網(wǎng)站信息。

Perplexity并非AI界的無(wú)名小卒,其背后支持資本涉及英偉達和貝索斯等知名企業(yè)和個(gè)人,這場(chǎng)抄襲指控的風(fēng)波在一定程度上給整個(gè)AI行業(yè)敲響了警鐘,關(guān)于信息抓取的合法化等問(wèn)題,其安全邊界到底在哪里?

在Perplexity面臨抄襲指控的同時(shí),有關(guān)Deepfake(深偽技術(shù))成本暴增的信息引發(fā)廣泛關(guān)注。

比抄襲指控更嚴重的是,Deepfake未來(lái)三年帶來(lái)的損失或將增加到400億美元,而這其中,就涉及由于A(yíng)I技術(shù)的飛速發(fā)展,所帶來(lái)的視頻、音頻和文檔信息造假等問(wèn)題。

一方面是AI技術(shù)正在滲透進(jìn)各行各業(yè),從B端企業(yè)到C端用戶(hù),AI技術(shù)的普及正在以前所未有的速度在各領(lǐng)域延伸,另一方面,則是來(lái)自對AI技術(shù)支持下,AI工具的安全性,合法合規性的保證,以及在抄襲,造假等危及行業(yè)發(fā)展的情況出現時(shí),反AI工具賽道正在迎來(lái)一場(chǎng)規?;l(fā)展的市場(chǎng)需求。

AI產(chǎn)品工具的安全合規性該如何保證,抄襲,造假風(fēng)波壓力之下,反AI工具市場(chǎng)會(huì )成為一個(gè)新方向嗎?

抄襲風(fēng)波再起,反AI抓取工具成熱門(mén)

早在今年4月,Perplexity相關(guān)人員就表達了對自身產(chǎn)品合規性的觀(guān)點(diǎn),彼時(shí),Perplexity正在以30億美元的估值尋求一輪新的融資,公司方面表示,它尊重出版商不抓取內容的要求,并且在合理使用版權法的范圍內運營(yíng)。

一方面是指控不道德的抓取為“抄襲”,另一方則表示在“合理”范圍內運行。作為AI搜索工具,無(wú)論Chatgpt還是Perplexity都必須采用大批量的網(wǎng)絡(luò )信息抓取以訓練其數據并豐富其內容;但另一方面,面對媒體信息采集的“獨家”性,以及出版商等對內容的保護需求,Perplexity之類(lèi)的AI工具如何平衡“抄襲”和“合理合規”之間的關(guān)系?

這個(gè)問(wèn)題的爭議存在于兩個(gè)方面:即機器人排除協(xié)議和版權法的合理利用。

對于信息產(chǎn)出網(wǎng)站來(lái)說(shuō),網(wǎng)站有權利使用機器人排除協(xié)議來(lái)明確標明其不希望被網(wǎng)絡(luò )爬蟲(chóng)抓取或訪(fǎng)問(wèn)的內容。

從版權法的角度來(lái)說(shuō),其建立法律框架,在特定要求之下,未經(jīng)許可或付費使用的內容,不允許被隨便抓取。

但是,如何明確這二者的界限,是一個(gè)答案相對模糊的問(wèn)題。

簡(jiǎn)單來(lái)說(shuō),Perplexity在抓取一些網(wǎng)站過(guò)程中,如遇到明確標明“以其他方式禁止 robots.txt”的文件,從遵從協(xié)議的角度,Perplexity會(huì )規避這些信息。

但另一個(gè)問(wèn)題在于,如果用戶(hù)手動(dòng)向AI搜索工具提供URL,Perplexity則會(huì )相應的幫助用戶(hù)去進(jìn)行信息抓取,在此過(guò)程中,Perplexity充當的并不是一個(gè)爬蟲(chóng)工具,而是幫助用戶(hù)在檢索他們的要求。

更明確一點(diǎn)來(lái)說(shuō),AI工具抓取了部分網(wǎng)站不允許抓取的內容,那么爭議點(diǎn)在于,這個(gè)內容的抓取,是AI工具所主導的,還是用戶(hù)所主導的。

在這種模糊的界限下,媒體方面針對不道德抓取信息指控Perplexity抄襲的問(wèn)題,也就有了更多可解釋的空間。

作為一個(gè)AI搜索引擎的頭部應用,Perplexity面臨的指控在一定程度上代表了現在,乃至未來(lái)AI應用在數據訓練和為用戶(hù)提供服務(wù)過(guò)程中,勢必會(huì )面臨的合法合規困境。

有研究數據顯示,網(wǎng)絡(luò )上排名前1000的網(wǎng)站中,約有26%的網(wǎng)站已經(jīng)屏蔽OpenAI的機器人,另有數據證實(shí),超600家新聞出版商已屏蔽OpenAI。

爭議空間之下,反AI浪潮帶來(lái)的市場(chǎng)空間開(kāi)始被發(fā)掘。

比如,云服務(wù)提供商Cloudflare推出了一款新的免費工具,以防止機器人抓取其平臺上托管的網(wǎng)站數據來(lái)訓練人工智能模型。

包括谷歌、OpenAI和蘋(píng)果在內的一些人工智能供應商,允許網(wǎng)站所有者通過(guò)修改其網(wǎng)站的robots.txt(告訴機器人可以訪(fǎng)問(wèn)網(wǎng)站上哪些頁(yè)面的文本文件)來(lái)阻止他們用于數據抓取和模型訓練的機器人。

Cloudflare方面表示:“當不良行為者試圖大規模抓取網(wǎng)站時(shí),他們通常會(huì )使用我們能夠識別指紋的工具和框架。”“根據這些信號,我們的模型能夠適當地將來(lái)自規避人工智能機器人的流量標記為機器人。”

Cloudflare還表示,已經(jīng)為主機建立了一個(gè)表格來(lái)報告可疑的AI機器人和爬蟲(chóng),并表示隨著(zhù)時(shí)間的推移,它將繼續手動(dòng)將AI機器人列入黑名單。

抄襲的指控,本質(zhì)上來(lái)說(shuō)是一場(chǎng)對信息的爭奪,以及對信息帶來(lái)商業(yè)化價(jià)值的利益之戰,在此過(guò)程中,反AI工具的存在某種程度上來(lái)說(shuō)是兩個(gè)對立群體之間的剛需。

市場(chǎng)空間也基于此被廣泛開(kāi)拓。

AI造假帶來(lái)400億美元損失,華人研究團隊爭奪視頻檢測市場(chǎng)

在這場(chǎng)反AI戰役中,媒體向Perplexity提出抄襲指控,是AI產(chǎn)品之間的資源爭奪。

但在另一方向,AI造假帶來(lái)的問(wèn)題則關(guān)系到C端用戶(hù),其輻射面積更廣,可能存在的隱患更多,從反AI產(chǎn)品開(kāi)發(fā)方向來(lái)看,其市場(chǎng)規模和需求似乎更大。

Deepfake是目前增長(cháng)最快的對抗性人工智能形式,數據顯示,與深度造假相關(guān)的損失預計將從2023年的123億美元增加到2027年的400億美元。

德勤預計,在深度造假領(lǐng)域,銀行和金融服務(wù)行業(yè)會(huì )成為重災區。

另有數據顯示,預計到2024年,世界范圍內產(chǎn)生的深度造假事件或將達到14到15萬(wàn)起。

如此龐大的數字令人瞠目。

而更恐怖的問(wèn)題在于,Deepfake視頻的主要受害者一部分是行業(yè)高管群體,另一部分則是女孩,包括部分女性名人。

比如企業(yè)高管群體,視頻和語(yǔ)音的深度偽造可以騙取他們大量的資金。

女孩受害者面臨的問(wèn)題則在于個(gè)人形象和名譽(yù)的受損,獨立研究員Genevieve Oh收集的數據顯示,2023 年上傳到互聯(lián)網(wǎng)的露骨深度偽造視頻比任何其他年份都要多,Deepfake視頻中絕大多數會(huì )以未經(jīng)同意的女性為主角生成色情視頻,甚至部分女性公眾人物也在受害者之列。

事實(shí)上,Deepfake不局限于視頻和音頻文檔等,其技術(shù)已經(jīng)發(fā)展到可以創(chuàng )建虛假I(mǎi)D,躲過(guò)加密貨幣網(wǎng)站的檢驗,從而進(jìn)行詐騙等活動(dòng)。

相比之下,Perplexity的抄襲風(fēng)波還僅僅存在于規則層面的擦邊,而Deepfake帶來(lái)的造假產(chǎn)業(yè)鏈,則是實(shí)打實(shí)的威脅著(zhù)人們的資金和信息安全。

早在去年,彭博社就報道稱(chēng):“暗網(wǎng)上已經(jīng)存在一個(gè)完整的產(chǎn)業(yè)鏈,以20美元到數千美元的價(jià)格出售詐騙軟件。”

專(zhuān)注于數字貨幣的新聞網(wǎng)站Coindesk曾發(fā)布報道稱(chēng),2022年加密貨幣用戶(hù)因“詐騙、詐騙和黑客攻擊”損失了近40億美元,2023年,這一數字約為約20億美元。

一方面可以看出,Deepfake帶來(lái)的欺詐問(wèn)題的重災區仍涉及金融相關(guān)的領(lǐng)域,另一方面,從2022年到2023年數字貨幣受詐騙影響帶來(lái)的損失數據波動(dòng)也可以推測,隨著(zhù)部分反AI技術(shù)和產(chǎn)品的出現,這些產(chǎn)品對于規避深度造假帶來(lái)的止損效果明顯。

Ivanti 發(fā)布的《2024 年網(wǎng)絡(luò )安全狀況報告》調查數據顯示,74%的受訪(fǎng)企業(yè)已經(jīng)看到人工智能威脅的證據,89%的受訪(fǎng)者認為人工智能驅動(dòng)的威脅才剛剛開(kāi)始。

在面對技術(shù)造假帶來(lái)的威脅,反AI的風(fēng)還是吹到了視頻甄別領(lǐng)域。

當Sora,Pika等還在競爭誰(shuí)生成的視頻更逼真的時(shí)候,對于A(yíng)I生成視頻進(jìn)行鑒別的賽道已經(jīng)打開(kāi)市場(chǎng)。

哥倫比亞大學(xué)楊俊鋒(Junfeng Yang)教授團隊開(kāi)發(fā)的名為DIVID(DIffusion-generated VIdeo Detector)的文生視頻檢測工具,就是針對Sora、Gen-2 和 Pika 等模型生成的視頻進(jìn)行檢測,目前其工具對AI視頻監測的準確率已經(jīng)達到 93.7%。

此前,該團隊已于今年早些時(shí)候發(fā)布了AI生成文本的檢測工具Raidar,這款工具在檢測文本是否為AI生成的過(guò)程中,不需要訪(fǎng)問(wèn)LLM大模型。

當然,從商業(yè)價(jià)值來(lái)說(shuō),對AI生成視頻進(jìn)行檢測,是市場(chǎng)包括普通用戶(hù)更需要的產(chǎn)品。

DIVID的誕生恰恰契合了我們前面關(guān)注的Deepfake的商業(yè)價(jià)值市場(chǎng),據了解,DIVID的研究人員表示,他們的技術(shù)有潛力作為插件集成到Zoom中,以實(shí)時(shí)檢測深度偽造電話(huà)。

對應此前Deepfake針對的行業(yè)高管偽造視頻的情況,DIVID的產(chǎn)品在利用技術(shù)保護用戶(hù),特別是B端市場(chǎng)用戶(hù)安全方面是一個(gè)非常具有參考意義的實(shí)踐。

當然,這也印證了這個(gè)市場(chǎng)未來(lái)的空間之大,需要更多的參與者融入進(jìn)去。

結語(yǔ)

AI技術(shù)的進(jìn)步過(guò)快,一方面推動(dòng)了社會(huì )多個(gè)行業(yè)的發(fā)展,但與此同時(shí),利用AI去擦邊,或者實(shí)施違法行為,一直都是存在且在發(fā)展中的市場(chǎng),盡管這個(gè)市場(chǎng)并未完全暴露在陽(yáng)光下,但其背后帶來(lái)的商業(yè)價(jià)值越大,對社會(huì )的危害也就越高。

“用AI打敗AI”或許會(huì )成為AI技術(shù)發(fā)展中一個(gè)始終存在的命題。當然,從商業(yè)化和道德倫理的角度,正面的反AI產(chǎn)品必然是這個(gè)社會(huì )所需要的,“用AI規范AI”的時(shí)代已經(jīng)到來(lái)。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全