科普|人工智能助力破解蛋白質(zhì)神奇結構密碼——2024年諾貝爾化學(xué)獎成果解讀
吉印通社斯德哥爾摩10月9日電 記者郭爽數十年前,預測蛋白質(zhì)三維結構,以及設計全新蛋白質(zhì)為人類(lèi)所用,被認為是一個(gè)不可能實(shí)現的夢(mèng)想。
“30年前,如果能用實(shí)驗設備解析一種蛋白質(zhì)結構就完全可以發(fā)表一篇博士論文,因為那是一件極為困難的事情,”諾貝爾化學(xué)委員會(huì )評委鄒曉冬9日接受吉印通社記者采訪(fǎng)時(shí)說(shuō),得益于今年諾貝爾化學(xué)獎獲獎成果,人們現在可以設計蛋白質(zhì),還可通過(guò)人工智能預測蛋白質(zhì)三維結構,“這是一個(gè)非常大的革命”。
曾經(jīng)不可實(shí)現的夢(mèng)想
蛋白質(zhì)是維持生命的重要大分子。它們是構成骨骼、皮膚、頭發(fā)等組織的基石,是驅動(dòng)肌肉的馬達,是讀取、復制和修復脫氧核糖核酸(DNA)的“機器”,是讓大腦中神經(jīng)元隨時(shí)準備運轉的“泵”,是促進(jìn)機體免疫反應的抗體,是細胞向外界傳遞信息的傳感器,是調節人體內所有細胞的激素。
蛋白質(zhì)通常由20種不同的氨基酸組成。在蛋白質(zhì)中,氨基酸以長(cháng)鏈連接在一起,折疊起來(lái)形成獨特的三維結構,這對蛋白質(zhì)的功能至關(guān)重要。要了解生命如何運作,首先就需要了解蛋白質(zhì)的形狀和結構。
自19世紀以來(lái),化學(xué)家就已了解蛋白質(zhì)對生命過(guò)程的重要性。但直到20世紀50年代,隨著(zhù)研究工具精度的提高,研究人員才開(kāi)始借助儀器解析蛋白質(zhì)三維結構。到20世紀70年代,研究人員已經(jīng)認識到,決定蛋白質(zhì)如何折疊的相關(guān)信息蘊含在組成蛋白質(zhì)的氨基酸序列中。從那時(shí)起,研究人員一直懷有一個(gè)夢(mèng)想,即試圖根據已知的氨基酸序列預測蛋白質(zhì)三維結構,但這非常困難,甚至一度被認為是不可能實(shí)現的夢(mèng)想。
“阿爾法圍棋”設計者破解蛋白質(zhì)結構之謎
然而,就在4年前,出現了一個(gè)驚人的突破。2020年,谷歌旗下“深層思維”公司的德米斯·哈薩比斯和約翰·江珀提出名為“阿爾法折疊2”的人工智能模型。
哈薩比斯是來(lái)自英國的神經(jīng)學(xué)家和企業(yè)家,他是“深層思維”公司的吉印通創(chuàng )始人和首席執行官。他從4歲開(kāi)始下國際象棋,2009年獲得英國倫敦大學(xué)學(xué)院認知神經(jīng)科學(xué)博士學(xué)位。他還曾領(lǐng)銜開(kāi)發(fā)“深層思維”公司的“阿爾法圍棋”程序,該程序在復雜的圍棋游戲中擊敗世界冠軍、韓國圍棋選手李世石。
江珀則是“深層思維”公司高級研究科學(xué)家,早年在美國芝加哥大學(xué)獲得理論化學(xué)博士學(xué)位,研究方向為使用機器學(xué)習模擬蛋白質(zhì)折疊。2021年,《自然》雜志曾將他列入年度“十大科學(xué)人物”。
“阿爾法折疊2”模型曾贏(yíng)得有著(zhù)生物計算領(lǐng)域“奧運會(huì )”之稱(chēng)的“蛋白質(zhì)結構預測關(guān)鍵評估(CASP)”比賽,并成為第一個(gè)能準確預測蛋白質(zhì)三維結構的機器學(xué)習模型。
“阿爾法折疊2”模型成功解決了科學(xué)家苦苦思索了數十年的難題——從氨基酸序列預測蛋白質(zhì)結構,它能夠預測幾乎所有已知的2億種蛋白質(zhì)的結構。
自問(wèn)世以來(lái),“阿爾法折疊2”已被用于海量科學(xué)應用中,例如人們用它應對抗生素耐藥性、尋找瘧疾等疾病的新療法等。“阿爾法折疊2”極大縮短了人工確定蛋白質(zhì)結構的時(shí)間,展示了人工智能對于科學(xué)發(fā)現的影響。此外,這項研究將有助于人們更好地了解疾病,并能加速新靶向藥物開(kāi)發(fā)。到今年10月,已有來(lái)自大約190個(gè)國家的200多萬(wàn)人使用了“阿爾法折疊2”程序。
設計全新蛋白質(zhì)開(kāi)辟無(wú)限可能
自然界中的蛋白質(zhì)種類(lèi)有限,研究人員希望創(chuàng )建出新的蛋白質(zhì)種類(lèi),使其執行諸如分解有害物質(zhì)或作為化學(xué)制造業(yè)工具等功能。該領(lǐng)域自20世紀90年代末興起,美國華盛頓大學(xué)西雅圖分校教授戴維·貝克在該領(lǐng)域取得突破。他開(kāi)發(fā)的名為Rosetta的軟件成功構建出不是天然存在的全新蛋白質(zhì)。
貝克的研究團隊首先提出一個(gè)全新結構的蛋白質(zhì),然后利用Rosetta計算哪種氨基酸序列可以生成所需的蛋白質(zhì)。為了驗證該軟件的成功率,貝克的研究小組將軟件建議的氨基酸序列基因引入細菌,這些細菌生產(chǎn)了所需的蛋白質(zhì)。然后,他們利用X射線(xiàn)晶體學(xué)確認了蛋白質(zhì)結構與他們的設計幾乎完全符合。該成果于2003年發(fā)表。
此后,他的研究小組不斷創(chuàng )造出一個(gè)又一個(gè)具有新功能的蛋白質(zhì),可用于催生新的納米材料、靶向藥物、疫苗研發(fā)、微型傳感器以及更環(huán)保的化學(xué)工業(yè)等,為實(shí)現人類(lèi)福祉開(kāi)辟了無(wú)限可能。
貝克當天接受電話(huà)采訪(fǎng)時(shí)說(shuō),他獲得這一殊榮是站在了巨人的肩膀上。蛋白質(zhì)結構預測真正凸顯了人工智能的力量,使人們得以將人工智能方法應用于蛋白質(zhì)設計,大大提高了設計的能力和準確性。