為什么AI不是大家想要的AI
難道未來(lái)的人工智能只能停留在畫(huà)畫(huà)、寫(xiě)詩(shī)這樣基于歷史知識的靜態(tài)任務(wù)上嗎?它能否真正融入我們的日常生活,完成如做飯、洗碗這樣需要與環(huán)境實(shí)時(shí)交互的挑戰?讓我們閱讀本文探討大模型在處理不同類(lèi)型任務(wù)時(shí)的表現和局限,以及未來(lái)AI在用戶(hù)交互方面的發(fā)展潛力。
你一定見(jiàn)過(guò)這句話(huà),“你想要AI掃地,洗碗,做飯,可是它在畫(huà)畫(huà),寫(xiě)詩(shī),唱歌”。這是因為信息技術(shù)從誕生到現在都是“程序化”的“存儲結構”設計,就是你必須“預先”“存好””程序”才能按“程序”進(jìn)行。你要快速實(shí)時(shí)處理,基本沒(méi)有“現場(chǎng)口占”,只有“數據在傳輸前的先過(guò)濾等基本處理的”邊云架構,你要實(shí)時(shí)處理還需要人進(jìn)行現場(chǎng)工作對實(shí)時(shí)采集的數據進(jìn)行分析。
而我們所說(shuō)的做飯,洗碗等需要與環(huán)境的實(shí)時(shí)交互,需要實(shí)時(shí)做出響應,以及對環(huán)境及其他干預的應對,這不是可以提前預設的。這是現場(chǎng)性的交互性的任務(wù)。而我們說(shuō)的畫(huà)畫(huà),寫(xiě)詩(shī),唱歌等這些看似是對人的創(chuàng )造性要求更高的活動(dòng),都是對過(guò)往的數據,歷史知識進(jìn)行總結,學(xué)習,在新的應用中并不必須強調交互性,現場(chǎng)性的任務(wù),所以現在大模型在應答,繪畫(huà),唱歌等這些依據過(guò)往經(jīng)驗的“靜態(tài)”應用中,效果很好,而對做飯,洗碗等這些活動(dòng),進(jìn)展稍慢。其實(shí)華為已經(jīng)實(shí)現了無(wú)圖自動(dòng)駕駛,自動(dòng)駕駛就是與環(huán)境交互的一個(gè)方面的行業(yè)應用,目前已進(jìn)入可以應對的高級自動(dòng)駕駛階段。
這是AI應用的一個(gè)分析。
現在大模型并不能被用戶(hù)進(jìn)行“交互性,實(shí)時(shí)性“教授,學(xué)習和改進(jìn),這也是大模型太大,訓練周期長(cháng),也不能交互學(xué)習,還是像各位家長(cháng)給孩子講題一樣,怎么講過(guò)還不會(huì ),又錯了。但是這個(gè)靠對過(guò)去知識講解的領(lǐng)域,很適合大模型。這也是畫(huà)畫(huà),寫(xiě)詩(shī),唱歌這些依靠歷史知識,靜態(tài)任務(wù),應用效果好的原因,因此行業(yè)上來(lái)講一個(gè)AI老師比家長(cháng)會(huì )耐心好多。
也就是說(shuō)大模型在對靜態(tài)任務(wù),依靠過(guò)去知識的語(yǔ)言處理上效果更契合,比如翻譯 ,問(wèn)答,編程等。而大家認為要求更高的寫(xiě)詩(shī),畫(huà)畫(huà),這些其實(shí)都是一種語(yǔ)言,自然適合大語(yǔ)言模型。
給予這個(gè)問(wèn)題問(wèn)下大模型,看他們怎么解決:
這兩天openAI剛發(fā)布了GPT4o mini,更小更便宜,用起來(lái)也會(huì )更省力更快,便于端側部署,在模型能力相當強大時(shí)候,和用戶(hù)的交互會(huì )是下一個(gè)亟需解決的問(wèn)題。
本文由 @蘇青言 原創(chuàng )發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載
題圖來(lái)自Unsplash,基于CC0協(xié)議