盡管AIGC爭議不斷,但我們都知道世界真的被改變了
“那些倒賣(mài)ChatGPT使用方法的人,有的都賺走上百萬(wàn)元了?!苯诘囊粓?chǎng)活動(dòng)上,一位資深媒體人為AIGC(人工智能生成內容)熱度發(fā)出這般感嘆。
如果說(shuō)柯潔對戰AlphaGo讓公眾小小地感受了一番AI震撼,那么2022年下半年以來(lái),自ChatGPT和Stable Diffusion掀起的AIGC浪潮,則是令主流互聯(lián)網(wǎng)用戶(hù)都感受到了AI技術(shù)有機會(huì )帶來(lái)的革命。在無(wú)數寓言和長(cháng)達數十年的研究投入后,AI終于要在更大范圍改變世界。
(圖源:ChatGPT)
通過(guò)對話(huà)式AI交互界面ChatGPT,人們可以很輕松地獲得像人類(lèi)一樣思考后產(chǎn)出的內容,小到一段對話(huà)一則公式,大到完整程序代碼和正式應用文。Stable Diffusion把已經(jīng)頗受關(guān)注的AI圖像生成技術(shù)更進(jìn)一步,只需要做出描述,就能以較高的精度和質(zhì)量生成對應畫(huà)面。
AI生成內容的效率遠超人類(lèi),引發(fā)了一系列懷疑和討論,但無(wú)論是那一方都不會(huì )否認的是,AI技術(shù)正在快速成長(cháng)并影響到更多的人和事。
“許愿機”更精準更高效
雖然伴隨著(zhù)相當巨大的訓練成本,也絲毫不影響大語(yǔ)言模型被業(yè)界視作實(shí)現對話(huà)式AI的有效路徑,Google等頂級科技企業(yè)均有進(jìn)行相關(guān)研發(fā)投入。OpenAI公司基于GPT 3.5模型打造的ChatGPT,一下子展現出了AI在內容生成方面的巨大潛力,有望代替大量機械的重復勞動(dòng)。
該產(chǎn)品能通過(guò)對話(huà)和即時(shí)獲取信息,快速針對用戶(hù)要求給出幾乎有求必應的回答,即使仍存在準確率問(wèn)題,但展現出來(lái)的邏輯性足以媲美人類(lèi)。濫用AI卻削弱了人腦訓練的擔憂(yōu)顯現出來(lái),國外部分高校已經(jīng)發(fā)文要求不能使用ChatGPT完成論文,必須經(jīng)過(guò)學(xué)生自主思考輸出。
(圖片來(lái)自:ChatGPT)
ChatGPT有著(zhù)一定使用門(mén)檻,而微軟基于背后技術(shù)打造的New Bing,讓更大范圍的人群體驗到對話(huà)式AI有多么“可怕”。目前已有部分注冊用戶(hù)可用,該產(chǎn)品能給到邏輯更清晰、信息引用也更明確的回復,免費模式也讓必應搜索用戶(hù)規模猛增,令Google感受到壓力。
微軟卻在New Bing上線(xiàn)數天內做了數次修改,極大限制了用戶(hù)詢(xún)問(wèn)的范圍和對話(huà)次數——不少用戶(hù)發(fā)現,該產(chǎn)品會(huì )在對話(huà)中表現出更多的“情感”甚至是攻擊性,這對于數年前就因AI對話(huà)失控而緊急下線(xiàn)產(chǎn)品的微軟是不可接受的,因而選擇減少推理次數防止AI“暴走”。
圖源:必應
取代Midjourney成為AI繪畫(huà)代名詞的Stable Diffusion,同樣在2023年2月迎來(lái)了一輪“暴走”,不過(guò)是開(kāi)發(fā)者熱情和社群討論熱度上的。過(guò)去數個(gè)月間,各路開(kāi)發(fā)者在開(kāi)源基礎上添磚加瓦研發(fā)各類(lèi)插件,其中幫助用戶(hù)快速制作能定向生成畫(huà)面的Lora模型相當火熱。
Lora可以通過(guò)數十張圖像和較短的時(shí)間,就訓練出畫(huà)面風(fēng)格和具體細節相當收斂的內容,例如特定藝術(shù)家的畫(huà)風(fēng)、攝影師的拍攝風(fēng)格、人物的相貌和搭配特色。Lora同時(shí)還推動(dòng)了真實(shí)化圖像生成的又一次爆發(fā),將ACG角色和真人結合的“賽博Coser”,在全球范圍引發(fā)話(huà)題。
(圖源:Stable Diffusion)
如何控制畫(huà)面元素來(lái)收斂到想要的圖像,是Stable Diffusion從誕生之日起就最為用戶(hù)關(guān)注的事情。最初主要通過(guò)提示詞(prompt)組合,來(lái)獲得盡可能接近描述的畫(huà)面內容,但背后是大量用戶(hù)不斷嘗試摸索并不能快速獲得結果,和Lora一樣生成定向內容的ControlNet出現。
ControlNet可快速分析參考圖的深度、輪廓、人物姿勢等信息,并輸出與提取出的信息一致的畫(huà)面。如此一來(lái),無(wú)需設計嘗試復雜的提示詞,就能生成符合要求的動(dòng)作或畫(huà)面元素。先使用各類(lèi)3D軟件生成動(dòng)作畫(huà)面,然后再輸入到AI生成畫(huà)面,整體生成效率得到顯著(zhù)提升。
AI解放更多勞動(dòng)力?
人們看待AIGC的態(tài)度,以及如何使用AIGC的方式,正在和這項技術(shù)一同快速轉變。
博士二年級的小鄭原本需要花費不少時(shí)間解讀學(xué)術(shù)論文,最近她發(fā)現New Bing也是個(gè)協(xié)助看論文的好工具。微軟將該AI植入Edge瀏覽器以提升用戶(hù)量,而與瀏覽器本身的PDF閱讀器功能組合,能讓New Bing直接解讀論文并提取關(guān)鍵信息,翻譯效率也比純人工高出不少。
除了讓AI幫忙快速“刷論文”,小鄭還在用New Bing和ChatGPT對話(huà)來(lái)給論文提供思路。她覺(jué)得AI在籌備論文過(guò)程中的偏重復勞動(dòng)部分能有效減輕工作量,生成的提綱和思路在不少時(shí)候的確能有作用,雖然在發(fā)散性思維及創(chuàng )新上依然有限,卻切切實(shí)實(shí)地減少了熬夜的必要。
(圖片來(lái)自:雷科技)
使用AI來(lái)完成論文的這段時(shí)間,小鄭也覺(jué)得很掙扎。AI遠超人類(lèi)的邏輯理解效率,令她開(kāi)始懷疑自己參與科研的身份和價(jià)值,懷疑自己是否真的有進(jìn)行下去的能力。導師和學(xué)校對于A(yíng)I的態(tài)度也讓她和同學(xué)保持擔憂(yōu),若習慣讓AI代勞后又一夜之間回到純手工勞動(dòng),會(huì )有不小打擊。
AI繪畫(huà)模型生成過(guò)程中的版權等倫理問(wèn)題,在多國美術(shù)工作者群體間引發(fā)了激烈爭吵,近期還有主打美術(shù)表現的游戲,因未經(jīng)告知就使用AI參與創(chuàng )作的素材向用戶(hù)道歉。不過(guò)在游戲、影視、廣告等行業(yè)中,越來(lái)越多的從業(yè)者開(kāi)始利用AI進(jìn)行創(chuàng )意指導,提升工作溝通效率。
大周在游戲制作組中承擔故事撰寫(xiě)和美術(shù)溝通工作,他需要跟美術(shù)同事反復溝通,來(lái)確保最終出現在游戲中的角色、道具、場(chǎng)景、UI乃至整個(gè)畫(huà)面,都是符合預期和項目要求的。最初他需要做出相對復雜的文字描述,還要找外部素材做參考圖,但始終少不了反復修改打磨。
(圖源:英偉達)
利用AI預先生成圖像來(lái)做參考,比起純文字和其他素材來(lái)得更準確,溝通過(guò)程變得更加直觀(guān)高效。大周覺(jué)得對美術(shù)的理解幫助他更有效生成參考圖,不過(guò)他有了新的煩惱,需要去安撫美術(shù)同事面對AI進(jìn)入工作流程的不滿(mǎn),試圖讓對方也認為這項技術(shù)的正面收益處于大多數。
跟蹤報道互聯(lián)網(wǎng)多年的寧寧最近得到復數信源爆料,多家國內互聯(lián)網(wǎng)公司正摩拳擦掌打造大語(yǔ)言模型。這場(chǎng)軍備競賽會(huì )擴大到幾乎所有能想到的大公司,而不僅限于在A(yíng)I深度耕耘多年且有貼吧、知道、百科等豐富語(yǔ)料來(lái)源的吉印通,AIGC正成為互聯(lián)網(wǎng)所追逐的下一個(gè)風(fēng)口。
和許多科技記者當下觀(guān)點(diǎn)類(lèi)似,寧寧并不看好國內互聯(lián)網(wǎng)公司一比一打造自己的ChatGPT。OpenAI在ChatGPT獲得現象級熱度之前,早就燒掉了一般科技公司無(wú)法接受的預算,研發(fā)周期更是長(cháng)到大多數人難以想象。她認為,互聯(lián)網(wǎng)公司做大語(yǔ)言模型很可能因缺少目標而放棄。
圖源:ATRIA
寧寧也表示,以具體的業(yè)務(wù)需求做導向,會(huì )是國內互聯(lián)網(wǎng)大規模應用AIGC的實(shí)際方向。實(shí)際上,已經(jīng)能夠在不少圖文、視頻內容平臺提供的創(chuàng )作工具中見(jiàn)到AI技術(shù)蹤影,AIGC應用范圍進(jìn)一步擴大更降低普通用戶(hù)創(chuàng )作門(mén)檻,個(gè)人用手機制作內容的精致程度有望得到普遍提升。
用好AI,路還很長(cháng)
New Bing將為微軟帶去怎樣的具體商業(yè)回報,現在還沒(méi)有定數,不過(guò)網(wǎng)易似乎有望成為最早將大語(yǔ)言模型提供的對話(huà)體驗轉化為業(yè)績(jì)的公司之一。預計2023年上線(xiàn)的網(wǎng)易旗下《逆水寒》手游,近期公布了“智能NPC”系統,能不受預設文本限制和NPC對話(huà),提升“大世界”沉浸感。
根據目前公開(kāi)的演示內容,玩家可用語(yǔ)音發(fā)言表達,無(wú)論是如何天馬行空的想法,游戲NPC都能理解并做出相應行動(dòng),于是每個(gè)人的游戲體驗都會(huì )不盡相同。在傳統游戲設計中,故事對話(huà)都基于預設文本展開(kāi),最多有數個(gè)選項可供選擇,而如此自由的交流無(wú)疑會(huì )大幅拓展可玩性。
(圖片來(lái)自逆水寒)
像是把《西部世界》電視劇帶到游戲中的該技術(shù),源自網(wǎng)易伏羲進(jìn)行的長(cháng)期A(yíng)I研究,與游戲結合實(shí)現有高自由度、可自生成體驗,也讓我們看到了AIGC落地產(chǎn)生更多商業(yè)價(jià)值的曙光。網(wǎng)易還表示已經(jīng)將可對話(huà)的NPC,按設定約束成“大宋江湖的人”,不會(huì )有超出游戲范圍的回應。
錢(qián)之外,如何解決好潛在的倫理道德問(wèn)題,也是AIGC目前的一大難點(diǎn)。早在數個(gè)月前,關(guān)于專(zhuān)門(mén)針對特定對象學(xué)習輸出畫(huà)面的討論,就曾讓AI繪畫(huà)陷入不小的風(fēng)波。很顯然,Lora在Stable Diffusion基礎上變得更有針對性,社群中就涌現了多個(gè)基于真實(shí)人物的模型。
更易于獲得的真實(shí)人物圖像,必然伴隨著(zhù)人物肖像權爭議,乃至可能會(huì )增加的詐騙案件數量。怎樣管理好涉及到真實(shí)人物的AIGC內容,避免潛在風(fēng)險并在更強大的AI技術(shù)出現前防范于未然,顯然會(huì )是接下來(lái)會(huì )受到?jīng)_擊的各方將要加大投入的部分。
在科幻作品中,AI常常被視作導致人類(lèi)危機的關(guān)鍵因素,好在現實(shí)中的AI技術(shù)不過(guò)是另一種提升效率的工具。隨著(zhù)更多的人了解AI不再霧里看花,開(kāi)始有越來(lái)越多的聲音在正視其工具屬性,當然想要AI最大效率發(fā)揮作用,還有技術(shù)進(jìn)步之外的大量工作要做。