未來,人們談起2024年的諾貝爾獎,或許會將其命名為“諾獎AI年”。繼物理學獎頒給兩位“AI教父”之后,化學獎又頒給了與人工智能密切相關的科學家。
當?shù)貢r間10月9日,瑞典皇家科學院宣布,將2024年諾貝爾化學獎授予大衛(wèi)·貝克(David Baker)、戴米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper),以表彰他們在蛋白質(zhì)設計和蛋白質(zhì)結構預測領域作出的貢獻。3名獲獎者共獲得1100萬瑞典克朗(約合745萬元人民幣)獎金。
諾獎官網(wǎng)截圖
人工智能將節(jié)省確定蛋白質(zhì)結構上的時間
蛋白質(zhì),一直是諾貝爾化學獎青睞的研究方向。蛋白質(zhì)是執(zhí)行生命功能的最重要的生物大分子,是生命的重要組成部分,也是化學家研究的重要對象,例如消化食物所需要的酶就是一種蛋白質(zhì)。
但以往的化學研究主要靠猜測、嘗試、糾錯,再猜測、再嘗試……這種研究范式下,科研人員必須在不斷試錯的過程中取得發(fā)現(xiàn),研究效率低、成本高。隨著化學研究對象日益復雜化、高維化,面對龐大的化學空間,配方和工藝的搜索常常止步于局部最優(yōu),無法進行全局探索。
數(shù)據(jù)驅動的人工智能給化學研究帶來不同的可能性。諾貝爾獎官方表示,2024年諾貝爾化學獎的主題是蛋白質(zhì)——生命中巧妙的化學工具。貝克成功完成了幾乎不可能的任務,構建了大量全新的蛋白質(zhì)。哈薩比斯和江珀開發(fā)了一種人工智能模型,解決了一個50年來的難題:預測蛋白質(zhì)的復雜結構。這些發(fā)現(xiàn)具有巨大的潛力。
據(jù)介紹,蛋白質(zhì)由20種不同的氨基酸組成,這些氨基酸可以被視為生命的構建模塊。2003年,貝克成功利用這些模塊設計出一種全新蛋白質(zhì)。他開發(fā)了著名的Rosetta軟件,極大地推動了蛋白質(zhì)結構預測的進展。從那時起,他的研究團隊創(chuàng)造了一個又一個富有想象力的蛋白質(zhì),包括可用于藥物、疫苗、納米材料和微小傳感器的蛋白質(zhì)。同時,他還將深度學習技術引入Rosetta軟件,并率先公開RoseTTAFold的源代碼。
諾獎直播截圖
哈薩比斯和江珀則是主導了人工智能模型AlphaFold的開發(fā)。哈薩比斯是DeepMind的創(chuàng)始人兼首席執(zhí)行官,同時也是AlphaFold項目的負責人。江珀則是AlphaFold項目的首席高級研究員。如今,AlphaFold2已對超過2億種蛋白質(zhì)進行了結構預測——幾乎是科學界已知的所有蛋白質(zhì)。這2億種蛋白質(zhì)的結構預測數(shù)據(jù)依然向公眾免費開放,使研究人員能夠像使用谷歌搜索信息一樣搜索蛋白質(zhì)的結構,為研究人員即時提供他們正在研究的任何蛋白質(zhì)的預測模型,大大減少了他們曾經(jīng)需要花在確定蛋白質(zhì)結構上的時間。
中國科學家已經(jīng)將AI應用到化學科研領域
2024年的諾貝爾化學獎和物理學獎,都與人工智能有關。這是否反映出未來科研的新風向?
南京大學化學化工學院教授、博導鄭鵬主要從事化學和生物學交叉的前沿科學研究領域,他向現(xiàn)代快報記者解釋了人工智能在化學領域的應用?!?024年諾貝爾化學獎得主大衛(wèi)·貝克(David Baker)近幾十年來一直從事蛋白質(zhì)設計研究,設計出自然界中不存在的蛋白質(zhì)分子,使其具有更好的功能或新穎的結構。”鄭鵬介紹,蛋白質(zhì)由氨基酸排列組合而成,設計難度非常高,最近5至10年里伴隨著人工智能的發(fā)展,大衛(wèi)·貝克將人工智能引入到蛋白質(zhì)設計領域,使得蛋白質(zhì)設計得到了質(zhì)的飛躍,設計出了很多具有應用價值的蛋白。
鄭鵬說,蛋白質(zhì)是由氨基酸線性排列組合構成,但絕大部分蛋白質(zhì)只有具備正確的三維結構才能行使功能,如何預測和得到蛋白的三維結構對科學家來說是一個很大的難題。而來自谷歌公司的戴米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper)兩位科學家,通過開發(fā)AlphaFold人工智能模型,實現(xiàn)了根據(jù)氨基酸序列準確預測蛋白質(zhì)結構的突破,“結構知道了,對應的功能也就能知道?!?/p>
兩組科學家從不同的方向來研究蛋白質(zhì)領域,為什么他們的研究如此重要呢?鄭鵬舉例說,“如果我們可以準確預測蛋白質(zhì)結構、設計相應的蛋白質(zhì)和分子,那么就可以根據(jù)癌癥相關的蛋白,改造已有的蛋白,設計靶向藥物,所以說他們的研究意義是非凡的,在人類生命健康領域有重要的應用,他們獲得諾貝爾化學獎是眾望所歸?!?/p>
鄭鵬所帶領的課題組正是從事相關領域的研究,他們運用人工智能算法來設計新的蛋白,課題組成功設計了一系列肌肉蛋白,其熱穩(wěn)定性可以超過120℃,未來可以作為材料在極端條件下使用。課題組還利用人工智能,針對新冠病毒、猴痘病毒及一些疾病來設計藥物。面對新冠疫情,鄭鵬帶領團隊最早在國際上揭示了N501Y突變導致病毒具有更強傳染性的原因,該成果被世界衛(wèi)生組織報告引用。
鄭鵬說,人工智能在助力化學和生命科研領域都已經(jīng)起到了顛覆性的作用,我國不少科學家都已經(jīng)利用AI設計了一系列更好的蛋白?!爸Z貝爾化學獎獲得者就是最早將AI應用在蛋白質(zhì)設計領域,取得了重大突破,人工智能已經(jīng)應用在很多學科、各行各業(yè)中。”
現(xiàn)代快報+記者 于露 是鐘寅 李鳴 李楠