“冷板凳”式科研過時(shí)了嗎
“化學(xué)研究的初級(jí)階段好比交通方式中的‘步行’,隨著技術(shù)手段升級(jí),研究程度加深、效率變高,等于用上了自行車、摩托車、汽車。當(dāng)引入人工智能,好比坐上火箭。最終必然‘量變引起質(zhì)變’,帶我們?nèi)ヒ郧叭ゲ涣说牡胤??!痹谥袊茖W(xué)技術(shù)大學(xué),精準(zhǔn)智能化學(xué)重點(diǎn)實(shí)驗(yàn)室主任李震宇用這樣一個(gè)比喻形容化學(xué)研究的變革。
“去以前去不了的地方”是李震宇和所在實(shí)驗(yàn)室團(tuán)隊(duì)孜孜不倦的科研追求。今年1月,中國科學(xué)院精準(zhǔn)智能化學(xué)重點(diǎn)實(shí)驗(yàn)室正式獲批建設(shè),由近100位年輕人組成,除化學(xué)與材料科學(xué)專業(yè)的師生外,還包括計(jì)算機(jī)、人工智能、大數(shù)據(jù)等方向的研究人員,聚焦如何改變化學(xué)研究范式這一關(guān)鍵科學(xué)問題,形成集群和協(xié)同攻關(guān)優(yōu)勢(shì)。
縱觀歷史,化學(xué)研究由煉丹、煉金演變而來,人類衣食住行離不開化學(xué)物質(zhì)。同時(shí),作為基礎(chǔ)科學(xué)的化學(xué),也是多學(xué)科交叉的聚集點(diǎn)和出發(fā)點(diǎn),化學(xué)研究在能源、環(huán)境、材料、生物醫(yī)藥等應(yīng)用領(lǐng)域扮演日益重要的角色。
歷經(jīng)數(shù)百年科研攀登,如今,精準(zhǔn)智能化學(xué)成為化學(xué)家的夢(mèng)想,更是實(shí)現(xiàn)化學(xué)學(xué)科跨越式發(fā)展的契機(jī)。而以人工智能為代表的新技術(shù)會(huì)不會(huì)重新定義化學(xué)的未來,改變化學(xué)研究的面貌?新興技術(shù)的雙刃劍會(huì)對(duì)研究范式帶來哪些沖擊和影響,師生們又有哪些對(duì)策和新招?這些問題一直縈繞在科研工作者心中。
化學(xué)版GPT來了,激起科研范式變革浪花
在精準(zhǔn)智能化學(xué)重點(diǎn)實(shí)驗(yàn)室中的機(jī)器化學(xué)家實(shí)驗(yàn)室,青年科研人員只需在控制大屏輸入指令,兩個(gè)動(dòng)作靈活的機(jī)器人“小來”和“小?!本涂梢栽趲讉€(gè)操作臺(tái)間穿梭,伸出機(jī)械手臂進(jìn)行試劑配制。
中國科大化學(xué)與材料科學(xué)學(xué)院教授江俊團(tuán)隊(duì)開發(fā)了全球首個(gè)集閱讀文獻(xiàn)、設(shè)計(jì)實(shí)驗(yàn)、自主優(yōu)化于一體,覆蓋化學(xué)品開發(fā)全流程的機(jī)器化學(xué)家平臺(tái),從數(shù)百萬的可能組合中找到全局最優(yōu)解加快材料研發(fā)。業(yè)內(nèi)專家認(rèn)為,該成果引領(lǐng)化學(xué)研究朝著知識(shí)理解數(shù)字化、操作指令化、創(chuàng)制智能化的趨勢(shì)前進(jìn),將對(duì)化學(xué)科學(xué)產(chǎn)生巨大影響。
江俊團(tuán)隊(duì)有近30位成員,大多是90后、95后,大家懷抱“做中國人自己的材料數(shù)據(jù)庫”的科研夢(mèng)想。在關(guān)鍵節(jié)點(diǎn)——建立數(shù)據(jù)庫知識(shí)圖譜時(shí),團(tuán)隊(duì)曾吃了很多苦頭:數(shù)據(jù)質(zhì)量良莠不齊,無法進(jìn)行高效檢索,不得不投入大量人力物力為數(shù)據(jù)打上識(shí)別標(biāo)簽。
無奈和碰壁倒逼江俊提升研究效率,2014年,建立會(huì)思考的“化學(xué)大腦”的念頭在江俊心中萌發(fā)。他找來人工智能、電子科技、數(shù)學(xué)、化學(xué)等專業(yè)方向人才,組成交叉學(xué)科背景的團(tuán)隊(duì),將大數(shù)據(jù)和人工智能技術(shù)注入平臺(tái)的計(jì)算大腦,建立理實(shí)交融的智能模型。歷經(jīng)8年探索,打造初代機(jī)器化學(xué)家“小來”。
值得一提的是,在高熵催化劑等實(shí)驗(yàn)中,“小來”可以從55萬種可能的金屬配比中找出全局最優(yōu)解,將傳統(tǒng)“試錯(cuò)法”實(shí)驗(yàn)所需的1400年科研周期縮短為5周。
論文閱讀、機(jī)器人做實(shí)驗(yàn)、數(shù)據(jù)分析、優(yōu)化篩選……當(dāng)前,江俊團(tuán)隊(duì)科研全流程都有人工智能的貢獻(xiàn)印記,今年年初,在多任務(wù)處理性能上實(shí)現(xiàn)升級(jí)的第二代機(jī)器化學(xué)家小?!罢Q生”。
如今,團(tuán)隊(duì)又自主研發(fā)了一款閱讀了50萬篇文獻(xiàn)的化學(xué)領(lǐng)域聊天機(jī)器人程序Chem-GPT,它能夠針對(duì)使用者提出的問題,給出從文獻(xiàn)中學(xué)習(xí)到的可靠答案,從而驅(qū)動(dòng)機(jī)器化學(xué)家做實(shí)驗(yàn),助力化學(xué)品和新材料研發(fā)。
江俊分析,人工智能給化學(xué)研究帶來如下改變:基于大語言模型,從文獻(xiàn)、專利、教科書等數(shù)據(jù)源中挖掘化學(xué)數(shù)據(jù),建立化學(xué)知識(shí)圖譜,用于支持化學(xué)研究決策和創(chuàng)新;建立物質(zhì)的結(jié)構(gòu)、組分、制備工藝等因素與性質(zhì)間的關(guān)系模型,用于指導(dǎo)新型的分子、材料、催化劑、藥物等的設(shè)計(jì)與優(yōu)化;結(jié)合人工智能技術(shù)幫助化學(xué)家自動(dòng)設(shè)計(jì)實(shí)驗(yàn)方案、優(yōu)化實(shí)驗(yàn)過程,并進(jìn)行自動(dòng)測(cè)量表征。
他談道,對(duì)人工智能機(jī)器人平臺(tái)而言,首要挑戰(zhàn)是“如何賦予機(jī)器人物質(zhì)級(jí)別的感知能力和對(duì)化學(xué)過程的預(yù)判能力”。這兩個(gè)能力是讓人工智能能夠真正理解復(fù)雜物質(zhì)世界、捕捉化學(xué)系統(tǒng)的本質(zhì)特征規(guī)律的關(guān)鍵。在他的科研藍(lán)圖里,未來研發(fā)出模仿學(xué)習(xí)人類科學(xué)家創(chuàng)造力、具備“看”“聞”“聽”“觸”環(huán)境感知的“智慧科學(xué)家”,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)與智能驅(qū)動(dòng)的化學(xué)研究新范式。
李震宇總結(jié)道,傳統(tǒng)的研究范式深度依賴于“試錯(cuò)法”,效率低。公眾對(duì)化學(xué)的認(rèn)識(shí)停留在不環(huán)保、不經(jīng)濟(jì)、不安全等刻板印象,迫切需要提升化學(xué)研究的精準(zhǔn)程度與效率,讓公眾對(duì)化學(xué)面貌有新的認(rèn)識(shí)。而人工智能等先進(jìn)技術(shù),無疑有助于探索建立化學(xué)研究的精準(zhǔn)化、智能化雙驅(qū)動(dòng)模式。
人工智能浪潮下,科研還需要坐“冷板凳”嗎
當(dāng)先進(jìn)技術(shù)不斷迭代應(yīng)用,讓人不禁思考,我們是否還需要“冷板凳”式的科研,反復(fù)試錯(cuò)的意義又在哪里?
近日,中國科學(xué)技術(shù)大學(xué)姚宏斌課題組、李震宇課題組與浙江工業(yè)大學(xué)陶新永課題組合作,基于雙碳背景下電化學(xué)儲(chǔ)能發(fā)展的新范式,設(shè)計(jì)開發(fā)出鑭系金屬鹵化物基固態(tài)電解質(zhì)新家族LixMyLnzCl3,在無任何電極修飾的情況下實(shí)現(xiàn)了室溫可運(yùn)行的全固態(tài)鋰金屬電池,成果于今年4月5日發(fā)表在《自然》(Nature)雜志上。
這一被業(yè)內(nèi)專家稱贊為電化學(xué)儲(chǔ)能領(lǐng)域固態(tài)電解質(zhì)材料新突破的背后,一群年輕人就飽嘗“冷板凳”之苦。從湘潭大學(xué)材料科學(xué)與工程專業(yè)推免至中國科大讀研的羅錦達(dá)是其中之一,進(jìn)組3年,他從零基礎(chǔ)“小白”成長為科研主力。
2021年2月,還在讀大四的羅錦達(dá)抱著學(xué)習(xí)的心態(tài)來到中國科大做畢業(yè)設(shè)計(jì),剛好趕上上述課題的萌芽狀態(tài)。大四畢業(yè)后,沒有畢業(yè)旅行和假期,他幾乎每天都在實(shí)驗(yàn)室中度過。每位前輩都耐心解答這位準(zhǔn)研一新生提出的每個(gè)問題,正是在這種尊重科研的氛圍下,“跨界”應(yīng)用化學(xué)方向的羅錦達(dá),往研究中心地帶快速成長靠攏。
由于對(duì)計(jì)算機(jī)編程感興趣,羅錦達(dá)每天一有空就前往圖書館讀論文、書籍。研究中,他和小伙伴每天晚上在實(shí)驗(yàn)室待到很晚,每人分別分析和復(fù)盤研究進(jìn)展。此前,組內(nèi)一位學(xué)長嘗試用第一性原理計(jì)算來研究材料擴(kuò)散性質(zhì),但由于沒有考慮到材料尺寸效應(yīng)以及界面的應(yīng)力作用,結(jié)果和預(yù)期相反。
“因?yàn)閷?shí)驗(yàn)原材料、環(huán)境天氣等客觀因素和操作不當(dāng)、經(jīng)驗(yàn)不足等主觀原因,研究過程中遇到挫折是家常便飯,尤其是理論計(jì)算,有時(shí)花費(fèi)大量時(shí)間精力,最后發(fā)現(xiàn)結(jié)果不盡人意。但不能因?yàn)橐粭l路走不通,就否定大的科研方向,要不斷總結(jié)原因?!绷_錦達(dá)說。
那位學(xué)長畢業(yè)離組后,羅錦達(dá)接過關(guān)鍵的理論計(jì)算模擬任務(wù),并調(diào)整思路,從零開始學(xué)習(xí)分子動(dòng)力學(xué)知識(shí)。他嘗試運(yùn)用密度泛函理論、分子動(dòng)力學(xué)模擬和鍵價(jià)位能等方法,來研究實(shí)驗(yàn)對(duì)象獨(dú)特的結(jié)構(gòu)和離子傳導(dǎo)機(jī)制,從原子尺度更好地理解鋰離子的擴(kuò)散行為,對(duì)后續(xù)實(shí)驗(yàn)合成有很大的指導(dǎo)作用。
處理計(jì)算模擬數(shù)據(jù)時(shí),羅錦達(dá)又化身“程序員”,自學(xué)編程語言python,他覺得,每天都專注解決一個(gè)新問題,這種生活開心且充實(shí)。
最終,團(tuán)隊(duì)根據(jù)計(jì)算機(jī)模擬結(jié)果,設(shè)計(jì)出常溫條件下可以穩(wěn)定存在的鑭系金屬氯化物,合成出相應(yīng)的固態(tài)電解質(zhì)。他們把研究數(shù)據(jù)錄入合肥先進(jìn)計(jì)算中心進(jìn)行模擬分析,最終實(shí)現(xiàn)鋰離子在空間里的快速傳導(dǎo)。
“先進(jìn)的技術(shù)可以幫助科研人員快速分析和處理知識(shí)、提取有用信息、找出規(guī)律和趨勢(shì)?!痹谝瓯罂磥?,有了先進(jìn)的計(jì)算方法,未來計(jì)劃引入人工智能機(jī)器學(xué)習(xí),可以優(yōu)化出更好的電解質(zhì)體系,探索新的高性能固態(tài)電解質(zhì)材料,實(shí)現(xiàn)更穩(wěn)定的界面并適配到實(shí)際的電池中。
但他同時(shí)指出,科研的本質(zhì)創(chuàng)新和發(fā)現(xiàn),以及對(duì)問題深入思考和探索,這些過程往往需要反復(fù)試錯(cuò)和不斷嘗試。即使在數(shù)據(jù)處理方面已經(jīng)有了成熟的技術(shù)工具,年輕人在做科研的數(shù)據(jù)積累階段仍然需要坐“冷板凳”,這是幫助年輕人更好理解問題的必經(jīng)之路。
李震宇持有相同看法。他觀察到,人工智能擅長高通量的精準(zhǔn)實(shí)驗(yàn)、大規(guī)模數(shù)據(jù)處理等能力,但并不具備人類的創(chuàng)造性和判斷力等思維能力,無法創(chuàng)造出超越現(xiàn)有新穎化學(xué)思想的方法。因此,“冷板凳”有助于培養(yǎng)對(duì)化學(xué)有深刻理解和洞察力的人才。
據(jù)江俊課題組核心成員肖恒宇博士分析,年輕人在科研數(shù)據(jù)積累時(shí),可以利用人工智能技術(shù)來加速數(shù)據(jù)生成、收集、整理,但在研究尚未深入的領(lǐng)域,缺乏經(jīng)驗(yàn)的學(xué)生需要反復(fù)試錯(cuò)。
人和AI如何“打配合”,科研效果才能最優(yōu)
采訪過程中,很多師生提到了化學(xué)研究中“數(shù)據(jù)”的重要性——數(shù)據(jù)和技術(shù)相伴相生,人與技術(shù)的“合作關(guān)系”也離不開數(shù)據(jù)的支撐。
江俊團(tuán)隊(duì)的機(jī)器化學(xué)家自誕生之初就與海量文獻(xiàn)數(shù)據(jù)打交道?!皵?shù)據(jù)時(shí)代給我們帶來新機(jī)遇,同時(shí)也帶來不少難題。本質(zhì)上說,智能來自對(duì)數(shù)據(jù)的學(xué)習(xí),數(shù)據(jù)少,有用的知識(shí)就少,一些小數(shù)據(jù)對(duì)于化學(xué)研究來說珍貴稀疏,因此,做實(shí)驗(yàn)‘很貴’?!苯≌f。
“現(xiàn)階段大部分?jǐn)?shù)據(jù)都是從文獻(xiàn)中收集來的,而文獻(xiàn)中的數(shù)據(jù)經(jīng)常是被‘美化’過的理想數(shù)據(jù)。此外,標(biāo)注數(shù)據(jù)需要大量人力物力,隨著數(shù)據(jù)需求上升,這部分成本會(huì)越來越高。”江俊課題組博士生喬欽禹說。
還有部分師生談及,由于現(xiàn)存研究數(shù)據(jù)來源多且雜,當(dāng)高質(zhì)量和低質(zhì)量數(shù)據(jù)混在一起,人工智能很容易學(xué)到“錯(cuò)誤的數(shù)據(jù)”,開頭就錯(cuò)了,后面自然會(huì)影響效率甚至準(zhǔn)確性。
算力算法的缺失也是現(xiàn)階段痛點(diǎn)之一。
由于GPU算力不足,使得江俊團(tuán)隊(duì)的ChemGPT“跑不快”,訓(xùn)練迭代起來很慢?!叭斯ぶ悄艽笠?guī)模應(yīng)用勢(shì)不可擋,現(xiàn)有人工智能算力不足是亟待解決的問題?!苯≌n題組的博士生馮毅也注意到類似問題。
“精準(zhǔn)化學(xué)非常依賴實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確性?!崩钫鹩罡嬖V記者,改變現(xiàn)有痛點(diǎn)的可行路徑是通過精準(zhǔn)計(jì)算和精準(zhǔn)制備,得到大量精準(zhǔn)數(shù)據(jù),從數(shù)據(jù)出發(fā)來得到高的化學(xué)智能。有了智能技術(shù)以后,再回過頭來對(duì)化學(xué)反應(yīng)、分子性質(zhì)、材料性質(zhì)進(jìn)行做精準(zhǔn)調(diào)控,形成完整的研究閉環(huán)。
喬欽禹也曾對(duì)二者的“分工”做過設(shè)想:低端、可重復(fù)的循環(huán)實(shí)驗(yàn)操作,交給人工智能、自動(dòng)化等技術(shù)來完成,以完成數(shù)據(jù)積累;而分析、創(chuàng)新、糾錯(cuò)等操作交給人來做,例如總結(jié)規(guī)律,發(fā)明創(chuàng)造等。
李震宇提出,最佳合作模式應(yīng)由人類提出科學(xué)問題和假設(shè),人工智能設(shè)計(jì)實(shí)驗(yàn)、采集數(shù)據(jù)、構(gòu)建模型并驗(yàn)證人的假說。同時(shí),人類可以根據(jù)人工智能化學(xué)實(shí)驗(yàn)機(jī)器人提供的數(shù)據(jù)和反饋,調(diào)整和改進(jìn)自己的化學(xué)思路和方法,共同完成更高水平的化學(xué)研究。
姚宏斌也期待,“希望整個(gè)范式更加精準(zhǔn)化、智能化,通過人工智能自主學(xué)習(xí)和優(yōu)化,可以針對(duì)復(fù)雜環(huán)境體系得到全局最優(yōu)解,最終有望跳出原有的試錯(cuò)法框架?!?/p>
技術(shù)加持下,人類科學(xué)研究的邊界在哪里
近年來,隨著人工智能算法、大數(shù)據(jù)技術(shù)等“火爆”名詞的出現(xiàn),有關(guān)“人類能否拓展科學(xué)研究邊界”的話題再度回歸。
“物理學(xué)領(lǐng)域,人類能夠探究到宇宙的起源和演化,但仍然無法解釋暗物質(zhì)和暗能量的本質(zhì);生命科學(xué)領(lǐng)域,我們已經(jīng)能夠破解基因密碼,但無法完全理解生命的起源和演化;社會(huì)科學(xué)領(lǐng)域,我們能夠通過大數(shù)據(jù)分析來研究人類行為和社會(huì)現(xiàn)象,但無法完全預(yù)測(cè)人類行為的復(fù)雜性和多樣性……”姚宏斌說,先進(jìn)技術(shù)為人類探究更深層次的科學(xué)問題提供更多可能性和機(jī)會(huì)。然而,科學(xué)探究的邊界并不由技術(shù)的發(fā)展所決定,它同時(shí)被人類對(duì)自然界的認(rèn)知和理解所限制著。
在他看來,當(dāng)科學(xué)技術(shù)不斷發(fā)展,人類可以更深入地探究自然界的奧秘,但科研工作者也需要不斷拓展自身認(rèn)知和理解,才能更好地理解和解釋自然界的復(fù)雜和多樣。
馮毅告訴記者,當(dāng)發(fā)達(dá)的技術(shù)解放了科學(xué)家的雙手,讓他們有更多的時(shí)間去思考,激發(fā)更多創(chuàng)新性成果,大家對(duì)于科學(xué)的認(rèn)知也就越深入,就會(huì)發(fā)現(xiàn)越來越多的問題和無法解釋的現(xiàn)象可以繼續(xù)探索。
喬欽禹也認(rèn)為人類的科學(xué)探究沒有邊界。他說:“先進(jìn)技術(shù)的出現(xiàn),就是讓我們不斷地拓展邊界。相應(yīng)的,有關(guān)部門應(yīng)該給予坐‘冷板凳’的年輕人更多物質(zhì)上和精神上的支持。對(duì)知識(shí)的渴求,永遠(yuǎn)是人類前進(jìn)的動(dòng)力之一?!?/p>
江俊的觀點(diǎn)是懷抱更開放的胸懷和心態(tài)去提升自我。他說:“現(xiàn)階段的科研知識(shí)樹已經(jīng)無比龐大,沒有人能看到全局,我們應(yīng)該找到自己喜歡的葉面。在任何一個(gè)專業(yè),在自身專業(yè)領(lǐng)域把知識(shí)脈絡(luò)看清楚,精準(zhǔn)、扎實(shí)掌握知識(shí)精髓?!?/p>
幾年來,他學(xué)習(xí)了很多新知識(shí),甚至試著向本科生學(xué)習(xí)弄清一些新問題,開組會(huì)時(shí),他甚至插不上嘴,只提供方向上的指導(dǎo)。
肖恒宇覺得,如果科學(xué)探究的邊界一詞是指科學(xué)的前沿,那么科學(xué)研究本身就是在不斷拓展科學(xué)的邊界、加強(qiáng)人類對(duì)自然的認(rèn)知過程;如果科學(xué)探究的邊界一詞是指人類科學(xué)不能超越的限制,該限制或許就代表人類目前所能觀測(cè)到的自然現(xiàn)象的集合,當(dāng)人類所創(chuàng)造的理論、預(yù)測(cè)的自然現(xiàn)象超越了這個(gè)集合之后,就無法證實(shí)或證偽理論,使得理論失去現(xiàn)實(shí)意義。
“當(dāng)討論話題回到原點(diǎn),其實(shí)人工智能是典型的問題驅(qū)動(dòng)學(xué)科,相關(guān)研究尚處于初級(jí)階段?;瘜W(xué)研究的體系是獨(dú)特且復(fù)雜的,看似簡單的化學(xué)反應(yīng),影響因素涉及分子結(jié)構(gòu)、材料性質(zhì)等?!崩钫鹩詈粲?,應(yīng)該研發(fā)專門服務(wù)于精準(zhǔn)化學(xué)研究的人工智能新算法,發(fā)展先進(jìn)的理論計(jì)算與實(shí)驗(yàn)表征方法,細(xì)化到溫度、壓強(qiáng)、分子式等各種參數(shù),必將大幅提升化學(xué)研究效率。
他進(jìn)一步解釋道:“科學(xué)研究本身就是在不斷拓展邊界、加強(qiáng)人類對(duì)自然的認(rèn)知過程。精密的儀器、高性能的計(jì)算方法、人工智能等先進(jìn)技術(shù)能夠幫助人們更快、更好地進(jìn)行科研探索,在可預(yù)見的將來加速擴(kuò)大科學(xué)研究的邊界?!?/p>
中青報(bào)·中青網(wǎng)記者 王海涵 來源:中國青年報(bào)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 除了推出大模型,AI發(fā)展還應(yīng)做什么
- 工信部等5部門:自2023年7月1日起 全國范圍全面實(shí)施國六排放標(biāo)準(zhǔn)6b階段
- 提振信心、釋放活力 前4個(gè)月民營企業(yè)進(jìn)出口比重提升至52.9%
- 人享其行、物暢其流 流動(dòng)中國釋放經(jīng)濟(jì)復(fù)蘇積極信號(hào)
- 黑龍江省農(nóng)業(yè)生產(chǎn)有序推進(jìn) 機(jī)械化播種提質(zhì)增效
- 遺址“生長” 文物“說話”
- 2023年補(bǔ)助地方公共文化服務(wù)資金合計(jì)下達(dá)約149.63億元
- 讓病歷具有靈魂
- 那些年輕人為什么主動(dòng)延期畢業(yè)
- 各路網(wǎng)傳頸椎病“自救指南”靠譜嗎 專家解讀來了