對于科學智能的未來研究方向,漆遠提到了依舊要選擇具有大科學價值的領(lǐng)域,另外也需要在社會和產(chǎn)業(yè)價值之間找到平衡點,去重點突破。
隨著2024年諾貝爾物理學獎和化學獎授予了人工智能相關(guān)研究,科學智能(科學和AI深度融合)及其研究方向引發(fā)了從科學家到公眾的廣泛關(guān)注,接下來將有哪些研究重點?
在11月11日下午舉辦的“2024科學智能創(chuàng)新論壇”上,上?茖W智能研究院(下稱“上智院”)聯(lián)合復旦大學、集智科學研究中心和阿里云,共同發(fā)布了科學智能前沿觀察報告,十大前沿方向涵蓋AI for Science、Science for AI和科學智能基礎(chǔ)設施三個維度。
其中,AI for Science的前沿方向包括垂直領(lǐng)域科學大模型、融入先驗知識的AI模型、基于LLM模型的科學研究、從提出假設到自動驗證的AI科學家,以及復雜世界的多智能體建模;Science for AI的前沿方向則覆蓋了物理世界的第一性原理和科學啟發(fā)的可解釋AI新架構(gòu);科學智能基礎(chǔ)設施前沿方向包括合成數(shù)據(jù)和新型智能計算。展望未來,面向可信可解釋的科學世界模型和上述九個方向共同構(gòu)成科學智能十大前沿。
十大前沿
上智院院長、復旦大學浩清教授漆遠在會上表示,AI與基礎(chǔ)科學的深度融合,將開啟AI與科學“雙螺旋引擎”共振驅(qū)動的科學研究新范式。AI for Science和Science for AI,類似DNA和RNA的雙螺旋結(jié)構(gòu),一方面,AI將成為科學研究探索的最前沿;另一方面,科學啟發(fā)的AI也將成為實現(xiàn)AGI的重要支撐。未來可望有更多的科學智能研究成果問鼎諾貝爾獎。“發(fā)布科學智能前沿觀察報告,就是希望推動和支持更多AI和基礎(chǔ)研究領(lǐng)域的科學家,深度融合無縫合作,共同探索科學智能的新未來,打造能夠自主發(fā)現(xiàn)復雜世界未知規(guī)律的‘AI愛因斯坦’!
為何叫雙螺旋引擎
科學智能(AI X Science)是一個新興的跨學科研究領(lǐng)域,其研究方向和驅(qū)動力(7.070, -0.24, -3.28%)可以表述為“雙螺旋引擎”:其一,將AI技術(shù)應用于具體領(lǐng)域的科學研究(AI for Science);其二,將領(lǐng)域?qū)W科知識用于AI算法和架構(gòu)的理解和改進(Science for AI)。
隨著大量數(shù)據(jù)的快速積累和文獻的爆炸式增長,人類科學家自身的信息處理能力達到極限,甚至成為研究突破的瓶頸。而越來越多的科學研究領(lǐng)域在面對復雜問題的挑戰(zhàn)時也難以利用傳統(tǒng)的數(shù)學和物理方法。如何將AI運用于垂直的科學領(lǐng)域研究,加速科學發(fā)現(xiàn),擴展科研邊界,是AI for Science的核心主題。
今年諾貝爾化學獎授予的AlphaFold2,即是AI算法用于解決科學領(lǐng)域重要問題的研究典范。AI for Science其他成功研究案例還包括AI可控核聚變、氣象模型等等。
不過,雖然已獲重大突破,但AI仍然面臨數(shù)據(jù)稀缺、耗能過大、解釋性較差等重大挑戰(zhàn)。而人類科學家已經(jīng)積累了各個學科領(lǐng)域的海量知識, 如何將科學家的經(jīng)驗和知識,甚至直覺和啟發(fā)式想法,轉(zhuǎn)化為AI系統(tǒng)的能力,構(gòu)成了Science for AI研究的重點。
漆遠接受第一財經(jīng)采訪時表示,今年的諾貝爾獎就是科學智能非常好的代表,隨著基礎(chǔ)研究科學家和人工智能科研人員的雙向奔赴,未來會看到更多科學智能的成果產(chǎn)生,這也會影響科研范式本身。對于科學智能的未來研究方向,他提到了依舊要選擇具有大科學價值的領(lǐng)域,另外也需要在社會和產(chǎn)業(yè)價值之間找到平衡點,去重點突破。
漆遠
多個大模型發(fā)布
除了科學智能前沿觀察報告,會上還發(fā)布了“PI-AGENT氣候領(lǐng)域大語言模型”、“女媧:生命流體大模型”&“女媧:基因?qū)Ш酱竽P汀薄ⅰ芭畫z:生物結(jié)構(gòu)大模型”。
上智院介紹,此次發(fā)布的“女媧:生物結(jié)構(gòu)大模型”類似于2024年諾貝爾獎成果AlphaFold和RoseTTAFold,通過生成式大模型生成生物結(jié)構(gòu),包括RNA、分子、蛋白質(zhì)等,主要應用于制藥產(chǎn)業(yè),因為生物結(jié)構(gòu)直接決定了藥物的功能。
“女媧:生物結(jié)構(gòu)大模型”團隊負責人、復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院研究員朱思語告訴第一財經(jīng),從產(chǎn)業(yè)應用角度來看,目前他們已與一些制藥CRO企業(yè)合作,開展藥物結(jié)構(gòu)合成的臨床前驗證。同時,他們還在探索通過官網(wǎng)提供API,供研究人員和企業(yè)申請調(diào)用女媧-生物結(jié)構(gòu)大模型的服務。“在生物數(shù)據(jù)方面,我們將與國家蛋白質(zhì)中心(上海設施)合作,通過分子動力學模擬積累動態(tài)蛋白數(shù)據(jù),為模型生成提供支持!
“女媧:基因?qū)Ш酱竽P汀眻F隊負責人、復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院副院長、研究員程遠解釋,之所以取名為“基因?qū)Ш酱竽P汀保窍M麑@些“暗物質(zhì)”對生命的作用機制提供一套“導航圖”,最終可以構(gòu)建出一套基因與基因之間、基因與環(huán)境之間、基因與外部刺激之間的關(guān)聯(lián)關(guān)系圖譜,就像我們在黑暗環(huán)境中有了一張導航地圖一樣!拔覀兿M麑⑦@套‘導航系統(tǒng)’開放給學術(shù)界和工業(yè)界,為未來的生命科學研究添磚加瓦。初期我們會首先開放基因調(diào)控關(guān)系圖譜和預測接口,然后逐步完善功能!
而對比上智院此前發(fā)布的“伏羲”大模型,11日發(fā)布的氣候領(lǐng)域大語言模型有何區(qū)別?
“氣候領(lǐng)域大語言模型”團隊負責人,復旦大學校長助理、上海創(chuàng)智學院副院長吳力波解釋,該模型是中國首個獨立自主研發(fā)的氣候科學大語言模型,模型融合海量領(lǐng)域?qū)I(yè)知識,通過智能體建模提升模型對科學事實的認知和總結(jié)能力、數(shù)據(jù)和信息的掌握能力,為氣候領(lǐng)域的研究人員和從業(yè)者提供全方位智能的AI科學家服務,加速氣候變化研究進展。
上智院首席戰(zhàn)略官,復旦大學兼職教授楊燕青