10月9日,瑞典皇家科學(xué)院宣布,將2024年諾貝爾化學(xué)獎(jiǎng)授予大衛(wèi)·貝克(David Baker)、戴米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper),以表彰他們在蛋白質(zhì)設(shè)計(jì)和蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域作出的貢獻(xiàn)。
蛋白質(zhì),是生命中精妙的化學(xué)工具。蛋白質(zhì)設(shè)計(jì)為何能摘得今年的諾獎(jiǎng)?記者邀請南京大學(xué)化學(xué)化工學(xué)院、化學(xué)和生物醫(yī)藥創(chuàng)新研究院教授鄭鵬進(jìn)行科普。
諾獎(jiǎng)熱門之選,蛋白質(zhì)結(jié)構(gòu)研究已獲頒10余次獎(jiǎng)項(xiàng)
眾所周知,諾獎(jiǎng)的初衷是為了表彰那些為全人類創(chuàng)造最大利益的貢獻(xiàn)者。在今年諾貝爾化學(xué)獎(jiǎng)的預(yù)測中,蛋白質(zhì)三維結(jié)構(gòu)的革命性技術(shù)——阿爾法折疊(AlphaFold)就位列其中,被認(rèn)為是今年奪獎(jiǎng)的熱門之選。
沒有蛋白質(zhì),生命就無法存在。我們現(xiàn)在可以預(yù)測蛋白質(zhì)結(jié)構(gòu)并設(shè)計(jì)自己的蛋白質(zhì),這給人類帶來了極大的益處。鄭鵬教授科普道,蛋白質(zhì)是生命執(zhí)行各類生理功能最重要生物大分子,在維持身體結(jié)構(gòu)、促進(jìn)代謝、支持免疫系統(tǒng)等方面發(fā)揮著至關(guān)重要的作用?!氨热?,用于消化的酶、抵御病毒的抗體、人體的肌肉都是由蛋白組成的?!编嶚i表示,蛋白質(zhì)設(shè)計(jì)與人類可以說息息相關(guān),可以讓人類獲得更加強(qiáng)壯的肌肉、更穩(wěn)定的蛋白類藥物,更有效的蛋白類靶向藥物……滿足人類的各種需求。
諾貝爾獎(jiǎng)官方表示,2024年諾貝爾化學(xué)獎(jiǎng)的主題是蛋白質(zhì)——生命中巧妙的化學(xué)工具。大衛(wèi)·貝克成功完成了幾乎不可能的任務(wù),構(gòu)建了大量全新的蛋白質(zhì)。戴米斯·哈薩比斯和約翰·江珀開發(fā)了一種名為AlphaFold2的人工智能模型,解決了一個(gè)50年來的難題:預(yù)測蛋白質(zhì)的復(fù)雜結(jié)構(gòu)。這些發(fā)現(xiàn)具有巨大的潛力。
事實(shí)上,蛋白質(zhì)結(jié)構(gòu)研究一直是諾貝爾化學(xué)獎(jiǎng)青睞的對象,至今已頒發(fā)十余次獎(jiǎng)項(xiàng),既包括重要蛋白(或復(fù)合物)的解析,也包括新技術(shù)或新方法的突破,因此該領(lǐng)域長期來看是生命科學(xué)前沿和焦點(diǎn)。
求解蛋白質(zhì)折疊之謎,借助計(jì)算機(jī)模擬“上帝之手”
諾獎(jiǎng)得主大衛(wèi)·貝克是一位美國生物化學(xué)家和計(jì)算生物學(xué)家,目前是美國華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所所長,以開創(chuàng)能夠預(yù)測和設(shè)計(jì)蛋白質(zhì)三維結(jié)構(gòu)的方法而聞名,也有多位中國留學(xué)生在其門下學(xué)習(xí)。
想做蛋白質(zhì)設(shè)計(jì),首先要破解蛋白質(zhì)的結(jié)構(gòu)。學(xué)過高中生物的都知道,蛋白質(zhì)由20種不同的氨基酸組合而成,氨基酸就像樂高塊一樣,通過不同的排列組合,形成有各種功能的蛋白質(zhì)?!暗?,線性排列的‘一維’蛋白質(zhì)是沒有功能的。科學(xué)家早就通過實(shí)驗(yàn)發(fā)現(xiàn):氨基酸序列很奇妙,就像有設(shè)計(jì)圖紙一樣,他們可以自發(fā)折疊為三維結(jié)構(gòu),并在細(xì)胞內(nèi)發(fā)揮特定功能。那么一條氨基酸序列是如何折疊成三維結(jié)構(gòu)的呢?”鄭鵬說,從20世紀(jì)80年代開始,大衛(wèi)·貝克就對這個(gè)問題產(chǎn)生興趣,并一直致力于解開蛋白質(zhì)折疊之謎。
“解開三維折疊之謎,是一個(gè)非常耗時(shí)耗力的工作,也不見得成功。”鄭鵬介紹,大衛(wèi)·貝克的貢獻(xiàn)是借助計(jì)算機(jī)的力量做蛋白質(zhì)結(jié)構(gòu)設(shè)計(jì)和預(yù)測相關(guān)的課題
1996年,大衛(wèi)·貝克與研究生們開始編寫一個(gè)叫做Rosetta的程序,這個(gè)程序有潛力根據(jù)一段氨基酸序列解出蛋白質(zhì)的結(jié)構(gòu)。Rosetta的程序設(shè)計(jì)用了一種十分巧妙的方法,它不是通過窮舉法從這些天文數(shù)字般的可能結(jié)構(gòu)中挨個(gè)尋找自由能最低的形狀,而是先分析蛋白質(zhì)的生物物理特性,模擬出一個(gè)大致的形狀,然后進(jìn)行微調(diào),只留下自由能更低的結(jié)果。這樣一來,研究人員可以更快預(yù)測出蛋白質(zhì)的結(jié)構(gòu)。
在Rosetta這個(gè)程序基礎(chǔ)上,2003年,大衛(wèi)·貝克的團(tuán)隊(duì)設(shè)計(jì)出了第一個(gè)原本并不存在于自然界中的蛋白質(zhì),它被命名為Top7,具有完全新穎的褶皺。接下來的幾年時(shí)間,大衛(wèi)的團(tuán)隊(duì)對Rosetta進(jìn)行了更多的優(yōu)化。如今,大衛(wèi)·貝克的實(shí)驗(yàn)室,以及他的合作伙伴們已能設(shè)計(jì)出一個(gè)又一個(gè)富有想象力的蛋白質(zhì),并證明能被用于藥物、疫苗、納米材料和微型傳感器。
3名獲獎(jiǎng)?wù)呔c人工智能領(lǐng)域有關(guān),蛋白質(zhì)結(jié)構(gòu)預(yù)測新工具獲一半獎(jiǎng)項(xiàng)
如果說大衛(wèi)·貝克近幾十年一直從事蛋白質(zhì)設(shè)計(jì)工作,戴米斯·哈薩比斯和約翰·江珀則是近十年才從事該研究,通過利用AI,在蛋白結(jié)構(gòu)預(yù)測取得了顛覆性成果。
根據(jù)網(wǎng)絡(luò)信息,約翰·江珀1985年出生,戴米斯·哈薩比斯是“75后”,他們帶領(lǐng)的是一支非常年輕的團(tuán)隊(duì)。
在2018年前,大衛(wèi)及其團(tuán)隊(duì)開發(fā)的Rosetta在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域完全沒有對手。而在那一年,戴米斯·哈薩比斯和約翰·江珀聯(lián)合研發(fā)的AI模型——AlphaFold讓大衛(wèi)感覺到了危機(jī),該模型能將蛋白質(zhì)結(jié)構(gòu)有關(guān)的物理知識和生物學(xué)知識結(jié)合起來,通過融入深度學(xué)習(xí)算法,根據(jù)氨基酸序列來對蛋白質(zhì)結(jié)構(gòu)進(jìn)行高精度的預(yù)測,讓人工智能快速成為蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的專家。盡管2018年的蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽依然是Rosetta拔得頭籌,但首次亮相就獲得了第二名的AlphaFold令大衛(wèi)·貝克見識到了機(jī)器學(xué)習(xí)的過人之處。于是,他要求團(tuán)隊(duì)緊跟時(shí)代的風(fēng)向,加緊研究機(jī)器學(xué)習(xí)。
他們真正取得驚人突破,僅僅在四年之前。鄭鵬介紹說,2020年,戴米斯·哈薩比斯和約翰·江珀首次公布了他們所開發(fā)的AlphaFold2人工智能模型。在該模型的幫助下,二人得以預(yù)測出當(dāng)時(shí)人們已確定的幾乎所有2億種蛋白質(zhì)的結(jié)構(gòu)。在2020年的競賽中,第二代AlphaFold擊敗了Rosetta,一舉成名。
兩個(gè)團(tuán)隊(duì)既有競爭關(guān)系,也在相互促進(jìn)。2021年7月15日,當(dāng)DeepMind公司在《自然》雜志上發(fā)表論文,公開了“AlphaFold2”的源代碼,并且詳細(xì)描述了它的設(shè)計(jì)框架和訓(xùn)練方法時(shí),大衛(wèi)的團(tuán)隊(duì)也在《科學(xué)》雜志上介紹了其開發(fā)的RoseTTAFold算法。
“兩位學(xué)者能這么快得獎(jiǎng),其實(shí)也反映了AI的發(fā)展及其在蛋白改造設(shè)計(jì)中的應(yīng)用趨勢是勢不可擋的?!蹦壳?,鄭鵬及團(tuán)隊(duì)也在運(yùn)用AI改造肌肉蛋白,針對猴痘病毒螺旋結(jié)構(gòu)進(jìn)行蛋白分子設(shè)計(jì)?!癆lphaFold已經(jīng)極大地減少了人工確定蛋白質(zhì)結(jié)構(gòu)的時(shí)間,在AI的輔助下,人工改造設(shè)計(jì)蛋白質(zhì)逐漸從幻想變?yōu)楝F(xiàn)實(shí),并已成為不可阻擋的未來發(fā)展趨勢。未來這項(xiàng)研究將有助于人們更好地了解疾病,并能加速新靶向藥物的開發(fā)?!?/p>
一審:唐郁文 丨二審:李艷丨三審:張偉偉
請輸入驗(yàn)證碼