對于科學(xué)智能的未來研究方向,漆遠(yuǎn)提到了依舊要選擇具有大科學(xué)價(jià)值的領(lǐng)域,另外也需要在社會和產(chǎn)業(yè)價(jià)值之間找到平衡點(diǎn),去重點(diǎn)突破。
隨著2024年諾貝爾物理學(xué)獎和化學(xué)獎授予了人工智能相關(guān)研究,科學(xué)智能(科學(xué)和AI深度融合)及其研究方向引發(fā)了從科學(xué)家到公眾的廣泛關(guān)注,接下來將有哪些研究重點(diǎn)?
在11月11日下午舉辦的“2024科學(xué)智能創(chuàng)新論壇”上,上?茖W(xué)智能研究院(下稱“上智院”)聯(lián)合復(fù)旦大學(xué)、集智科學(xué)研究中心和阿里云,共同發(fā)布了科學(xué)智能前沿觀察報(bào)告,十大前沿方向涵蓋AI for Science、Science for AI和科學(xué)智能基礎(chǔ)設(shè)施三個維度。
其中,AI for Science的前沿方向包括垂直領(lǐng)域科學(xué)大模型、融入先驗(yàn)知識的AI模型、基于LLM模型的科學(xué)研究、從提出假設(shè)到自動驗(yàn)證的AI科學(xué)家,以及復(fù)雜世界的多智能體建模;Science for AI的前沿方向則覆蓋了物理世界的第一性原理和科學(xué)啟發(fā)的可解釋AI新架構(gòu);科學(xué)智能基礎(chǔ)設(shè)施前沿方向包括合成數(shù)據(jù)和新型智能計(jì)算。展望未來,面向可信可解釋的科學(xué)世界模型和上述九個方向共同構(gòu)成科學(xué)智能十大前沿。
十大前沿
上智院院長、復(fù)旦大學(xué)浩清教授漆遠(yuǎn)在會上表示,AI與基礎(chǔ)科學(xué)的深度融合,將開啟AI與科學(xué)“雙螺旋引擎”共振驅(qū)動的科學(xué)研究新范式。AI for Science和Science for AI,類似DNA和RNA的雙螺旋結(jié)構(gòu),一方面,AI將成為科學(xué)研究探索的最前沿;另一方面,科學(xué)啟發(fā)的AI也將成為實(shí)現(xiàn)AGI的重要支撐。未來可望有更多的科學(xué)智能研究成果問鼎諾貝爾獎!鞍l(fā)布科學(xué)智能前沿觀察報(bào)告,就是希望推動和支持更多AI和基礎(chǔ)研究領(lǐng)域的科學(xué)家,深度融合無縫合作,共同探索科學(xué)智能的新未來,打造能夠自主發(fā)現(xiàn)復(fù)雜世界未知規(guī)律的‘AI愛因斯坦’!
為何叫雙螺旋引擎
科學(xué)智能(AI X Science)是一個新興的跨學(xué)科研究領(lǐng)域,其研究方向和驅(qū)動力(7.070, -0.24, -3.28%)可以表述為“雙螺旋引擎”:其一,將AI技術(shù)應(yīng)用于具體領(lǐng)域的科學(xué)研究(AI for Science);其二,將領(lǐng)域?qū)W科知識用于AI算法和架構(gòu)的理解和改進(jìn)(Science for AI)。
隨著大量數(shù)據(jù)的快速積累和文獻(xiàn)的爆炸式增長,人類科學(xué)家自身的信息處理能力達(dá)到極限,甚至成為研究突破的瓶頸。而越來越多的科學(xué)研究領(lǐng)域在面對復(fù)雜問題的挑戰(zhàn)時(shí)也難以利用傳統(tǒng)的數(shù)學(xué)和物理方法。如何將AI運(yùn)用于垂直的科學(xué)領(lǐng)域研究,加速科學(xué)發(fā)現(xiàn),擴(kuò)展科研邊界,是AI for Science的核心主題。
今年諾貝爾化學(xué)獎授予的AlphaFold2,即是AI算法用于解決科學(xué)領(lǐng)域重要問題的研究典范。AI for Science其他成功研究案例還包括AI可控核聚變、氣象模型等等。
不過,雖然已獲重大突破,但AI仍然面臨數(shù)據(jù)稀缺、耗能過大、解釋性較差等重大挑戰(zhàn)。而人類科學(xué)家已經(jīng)積累了各個學(xué)科領(lǐng)域的海量知識, 如何將科學(xué)家的經(jīng)驗(yàn)和知識,甚至直覺和啟發(fā)式想法,轉(zhuǎn)化為AI系統(tǒng)的能力,構(gòu)成了Science for AI研究的重點(diǎn)。
漆遠(yuǎn)接受第一財(cái)經(jīng)采訪時(shí)表示,今年的諾貝爾獎就是科學(xué)智能非常好的代表,隨著基礎(chǔ)研究科學(xué)家和人工智能科研人員的雙向奔赴,未來會看到更多科學(xué)智能的成果產(chǎn)生,這也會影響科研范式本身。對于科學(xué)智能的未來研究方向,他提到了依舊要選擇具有大科學(xué)價(jià)值的領(lǐng)域,另外也需要在社會和產(chǎn)業(yè)價(jià)值之間找到平衡點(diǎn),去重點(diǎn)突破。
漆遠(yuǎn)
多個大模型發(fā)布
除了科學(xué)智能前沿觀察報(bào)告,會上還發(fā)布了“PI-AGENT氣候領(lǐng)域大語言模型”、“女媧:生命流體大模型”&“女媧:基因?qū)Ш酱竽P汀、“女媧:生物結(jié)構(gòu)大模型”。
上智院介紹,此次發(fā)布的“女媧:生物結(jié)構(gòu)大模型”類似于2024年諾貝爾獎成果AlphaFold和RoseTTAFold,通過生成式大模型生成生物結(jié)構(gòu),包括RNA、分子、蛋白質(zhì)等,主要應(yīng)用于制藥產(chǎn)業(yè),因?yàn)樯锝Y(jié)構(gòu)直接決定了藥物的功能。
“女媧:生物結(jié)構(gòu)大模型”團(tuán)隊(duì)負(fù)責(zé)人、復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院研究員朱思語告訴第一財(cái)經(jīng),從產(chǎn)業(yè)應(yīng)用角度來看,目前他們已與一些制藥CRO企業(yè)合作,開展藥物結(jié)構(gòu)合成的臨床前驗(yàn)證。同時(shí),他們還在探索通過官網(wǎng)提供API,供研究人員和企業(yè)申請調(diào)用女媧-生物結(jié)構(gòu)大模型的服務(wù)。“在生物數(shù)據(jù)方面,我們將與國家蛋白質(zhì)中心(上海設(shè)施)合作,通過分子動力學(xué)模擬積累動態(tài)蛋白數(shù)據(jù),為模型生成提供支持。”
“女媧:基因?qū)Ш酱竽P汀眻F(tuán)隊(duì)負(fù)責(zé)人、復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院副院長、研究員程遠(yuǎn)解釋,之所以取名為“基因?qū)Ш酱竽P汀保窍M麑@些“暗物質(zhì)”對生命的作用機(jī)制提供一套“導(dǎo)航圖”,最終可以構(gòu)建出一套基因與基因之間、基因與環(huán)境之間、基因與外部刺激之間的關(guān)聯(lián)關(guān)系圖譜,就像我們在黑暗環(huán)境中有了一張導(dǎo)航地圖一樣!拔覀兿M麑⑦@套‘導(dǎo)航系統(tǒng)’開放給學(xué)術(shù)界和工業(yè)界,為未來的生命科學(xué)研究添磚加瓦。初期我們會首先開放基因調(diào)控關(guān)系圖譜和預(yù)測接口,然后逐步完善功能!
而對比上智院此前發(fā)布的“伏羲”大模型,11日發(fā)布的氣候領(lǐng)域大語言模型有何區(qū)別?
“氣候領(lǐng)域大語言模型”團(tuán)隊(duì)負(fù)責(zé)人,復(fù)旦大學(xué)校長助理、上海創(chuàng)智學(xué)院副院長吳力波解釋,該模型是中國首個獨(dú)立自主研發(fā)的氣候科學(xué)大語言模型,模型融合海量領(lǐng)域?qū)I(yè)知識,通過智能體建模提升模型對科學(xué)事實(shí)的認(rèn)知和總結(jié)能力、數(shù)據(jù)和信息的掌握能力,為氣候領(lǐng)域的研究人員和從業(yè)者提供全方位智能的AI科學(xué)家服務(wù),加速氣候變化研究進(jìn)展。
上智院首席戰(zhàn)略官,復(fù)旦大學(xué)兼職教授楊燕青