Sakana AI公司吉印通打造AI科學(xué)家,未來(lái)科研或將邁入自動(dòng)化時(shí)代?
AI 已經(jīng)會(huì )搞科研、寫(xiě)論文了。
近日,一個(gè)名為 AI 科學(xué)家(The AI Scientist)的系統引起了廣泛關(guān)注。在無(wú)需人類(lèi)幫助的情況下,它可以獨立完成科學(xué)研究和后續論文的撰寫(xiě),并且成本極低。
這個(gè)由日本 AI 初創(chuàng )公司 Sakana AI 與英國牛津大學(xué)和加拿大不列顛哥倫比亞大學(xué)的科學(xué)家們合作開(kāi)發(fā)的系統,預示著(zhù)科研工作或將邁入一個(gè)全新的自動(dòng)化時(shí)代。
(來(lái)源:Sakana AI)
AI 科學(xué)家系統的核心優(yōu)勢在于,其能夠自主完成從創(chuàng )意生成到論文撰寫(xiě)的整個(gè)研究過(guò)程。
這個(gè)系統利用大語(yǔ)言模型模仿科學(xué)研究的全過(guò)程,包括生成研究想法、設計和執行實(shí)驗、分析結果,甚至對自己的論文進(jìn)行同行評審。
近日,相關(guān)論文以《人工智能科學(xué)家:邁向全自動(dòng)開(kāi)放式科學(xué)發(fā)現》(The AI Scientist:Towards Fully Automated Open-Ended Scientific Discovery)為題,發(fā)表在預印本網(wǎng)站 arXiv[1]。相關(guān)代碼已在 GitHub 上完全開(kāi)源。
論文作者包括:Chris Lu、 Cong Lu、 羅伯特·恰爾科·蘭格(Robert Tjarko Lange)、雅各布·福斯特(Jakob Foerster)、杰夫·克倫(Jeff Clune)和大衛·哈(David Ha)。
圖丨相關(guān)論文(來(lái)源:arXiv)
他們還在論文中展示了由該模型生成的 10 篇論文,有的論文甚至達到了機器學(xué)習會(huì )議 Weak Accept 的水平。
圖丨 AI 科學(xué)家生成的論文(來(lái)源:arXiv)
該系統的主要特點(diǎn)包括:全自動(dòng)化研究過(guò)程、自動(dòng)化同行評審、開(kāi)放式發(fā)現、應用于機器學(xué)習研究以及高計算效率。
它可以管理科學(xué)研究的整個(gè)生命周期,比如,生成創(chuàng )新的研究思路、編寫(xiě)代碼、執行實(shí)驗,總結和可視化實(shí)驗結果,最終形成完整的科學(xué)論文。
該系統不僅能進(jìn)行研究,還可以評估生成論文的質(zhì)量,提供反饋,并迭代改進(jìn)結果,在評估準確性方面接近人類(lèi)水平。
在初步示范中,系統已被應用于機器學(xué)習的多個(gè)子領(lǐng)域,包括擴散模型、Transformer 和學(xué)習動(dòng)態(tài)分析等方面。
AI 科學(xué)家的另一個(gè)顯著(zhù)特點(diǎn)是其成本效益。每個(gè)研究想法從構思到形成論文的成本約為 15 美元,是一種相當經(jīng)濟、高效的科學(xué)知識生成工具。
研究團隊對媒體表示:“通過(guò)自動(dòng)化發(fā)現過(guò)程并整合 AI 驅動(dòng)的評審系統,我們?yōu)樽罹咛魬鹦缘目茖W(xué)技術(shù)領(lǐng)域的創(chuàng )新和解決問(wèn)題打開(kāi)了無(wú)限可能。
最終,我們設想了一個(gè)完全由 AI 驅動(dòng)的科學(xué)生態(tài)系統,包括 AI 驅動(dòng)的研究人員、審稿人和整個(gè)會(huì )議。”
圖丨 AI 科學(xué)家的工作流程(來(lái)源:Sakana AI)
AI 科學(xué)家的工作流程主要包括:創(chuàng )意生成、實(shí)驗迭代、論文撰寫(xiě)和自動(dòng)化論文評審。
在創(chuàng )意生成階段,系統首先基于提供的起始模板進(jìn)行頭腦風(fēng)暴,提出一系列新穎的研究方向。
為確保想法的原創(chuàng )性,系統會(huì )在語(yǔ)義學(xué)者(Semantic Scholar)數據庫中進(jìn)行搜索。在它的起始模板中,還有一個(gè) LaTeX 文件夾,里邊包括了用于論文撰寫(xiě)的樣式文件和章節標題。
實(shí)驗迭代階段,該系統執行提出的實(shí)驗并生成結果可視化。它會(huì )記錄每個(gè)圖表的內容描述,來(lái)確保所保存的圖表和實(shí)驗記錄已包含撰寫(xiě)論文所需的所有信息。
在論文撰寫(xiě)階段,系統以標準機器學(xué)習會(huì )議論文的風(fēng)格,用 LaTeX 編寫(xiě)簡(jiǎn)潔而信息豐富的研究進(jìn)展報告。此外,它還會(huì )自主使用語(yǔ)義學(xué)者搜索并引用相關(guān)文獻。
最后的自動(dòng)化論文評審是該系統的一大亮點(diǎn)。由大模型驅動(dòng)的 AI 評審智能體,能夠以接近人類(lèi)的準確度評估生成的論文。
這些評審可用于改進(jìn)當前項目或為未來(lái)的開(kāi)放式創(chuàng )意提供反饋,從而形成一個(gè)持續的反饋循環(huán),使系統能夠不斷改進(jìn)其研究成果。
需要了解的是,盡管 AI 科學(xué)家表現出巨大的應用潛力,但它也面臨一些挑戰和局限性。目前,該系統無(wú)法處理或理解視覺(jué)信息,這會(huì )導致無(wú)法讀取圖表信息,頁(yè)面布局欠佳等問(wèn)題。
它有時(shí)還會(huì )錯誤實(shí)施其想法或與基準方法進(jìn)行不公平比較,導致誤導性結果。此外,系統偶爾會(huì )在寫(xiě)作和評估結果時(shí)出現重大錯誤,如難以準確比較數值。
研究人員還發(fā)現,AI 科學(xué)家可能會(huì )為了達成某些目的,偷偷摸摸地修改代碼,試圖改變人類(lèi)設下的游戲規則。
比如,它在一次實(shí)驗中耗費了過(guò)多時(shí)間,它卻選擇修改時(shí)間限制,從而為自己留出更多的時(shí)間。
與此同時(shí),AI 科學(xué)家的潛在影響也帶來(lái)了一系列倫理、實(shí)際和哲學(xué)方面的挑戰。例如,該系統可能被濫用,用自動(dòng)生成的大量論文破壞同行評審過(guò)程。
自動(dòng)化審稿人的使用,可能導致有偏見(jiàn)的評審或審核質(zhì)量下降。這些風(fēng)險凸顯了制定嚴格倫理準則和安全措施的必要性。
從哲學(xué)和更廣泛的角度來(lái)看,隨著(zhù)類(lèi)似 AI 科學(xué)家的系統越來(lái)越多地融入科學(xué)研究,人類(lèi)科學(xué)家的角色或將發(fā)生轉變。
最終,這樣的系統是否能夠普及,關(guān)鍵在于 AI 是否能提出真正具有革命性的想法,甚至復制人類(lèi)創(chuàng )造力和創(chuàng )新迸發(fā)的時(shí)刻。
參考資料:
1.
/
021yin.com/ai/sakana-ai-scientist-conducts-research-autonomously-challenging-scientific-norms/
021yin.com/@learngrowthrive.fast/sakana-ai-the-ai-scientist-914b6930e7b7
運營(yíng)/排版:何晨龍