已故大師“復(fù)現(xiàn)”,數(shù)智人大學(xué)還遠(yuǎn)嗎
“您好,蔣院士!請(qǐng)問您在華東師范大學(xué)讀書時(shí)印象最深的事情是什么?”
“在華東師大讀書時(shí),我印象最深的是1990年深秋,潘道暟先生鼓勵(lì)研究生們自己去參加學(xué)術(shù)會(huì)議。我與戴立益一起參加第三屆全國量子化學(xué)會(huì)議,結(jié)識(shí)了許多專業(yè)領(lǐng)域的頂尖人物,這次經(jīng)歷點(diǎn)燃了我的新志向?!?/p>
2024年1月,在華東師范大學(xué)上海普陀校區(qū)的理科大樓二樓軟件工程學(xué)院大廳,一塊一人高的電子屏幕上,出現(xiàn)的是已故中國科學(xué)院院士、中國科學(xué)院上海藥物研究所原所長、華東師大校友蔣華良的形象。屏幕中的“蔣華良”,是該校軟件工程學(xué)院國家工程中心副主任、高級(jí)工程師王江濤團(tuán)隊(duì)研發(fā)的數(shù)智人形象,該項(xiàng)目的發(fā)起人是華東師大校長、中國工程院院士錢旭紅,牽頭人是蔣華良的學(xué)生、華東師大藥學(xué)院院長李洪林。數(shù)智人能模擬蔣華良院士的語氣、南方普通話口音以及說話的形態(tài)等,并與提問者自然對(duì)話。
“我們未來可能建成全球首個(gè)數(shù)智人教育平臺(tái)——數(shù)智人大學(xué),采用文理工大跨度交叉、虛擬與現(xiàn)實(shí)深度融合方式,建立數(shù)智人的關(guān)鍵技術(shù)標(biāo)準(zhǔn),打造數(shù)智人的標(biāo)準(zhǔn)化應(yīng)用與數(shù)據(jù)庫,不斷完善‘?dāng)?shù)智化’評(píng)價(jià)治理體系?!卞X旭紅介紹,未來各種數(shù)智人可能會(huì)出現(xiàn)在華東師大的各個(gè)角落,與師生互動(dòng)。
“復(fù)現(xiàn)”大師難度遠(yuǎn)超想象
“爸爸雖然不在了,但能以這樣的形式讓他‘復(fù)現(xiàn)’,對(duì)我們來說也是一種陪伴。”蔣華良院士的女兒蔣雨惜說,她全程參與了用新技術(shù)“復(fù)現(xiàn)大師”的過程。
從2023年4月開始,蔣雨惜每個(gè)月都會(huì)與王江濤團(tuán)隊(duì)至少溝通一次,“項(xiàng)目組團(tuán)隊(duì)每個(gè)月會(huì)根據(jù)我、我母親和李洪林老師的意見更新迭代數(shù)智人模型,然后再讓我們提意見”。
蔣雨惜提出的意見,包括“與父親的語氣不太一致”“父親的南方普通話口音問題”“表情有些太生硬”“眨眼睛的頻次太低”等。
為了塑造一個(gè)更加真實(shí)的“蔣華良”,王江濤團(tuán)隊(duì)想了很多辦法。比如,他們前期向蔣院士的親朋好友收集了大約450條數(shù)據(jù),每一條數(shù)據(jù)都要人工核對(duì),刪除部分無用數(shù)據(jù)。數(shù)據(jù)確定后,他們要用大模型算法,讓數(shù)智人對(duì)數(shù)據(jù)內(nèi)容進(jìn)行學(xué)習(xí)——不過,由于數(shù)據(jù)總量不算多,數(shù)智人訓(xùn)練2萬次和5萬次,所表現(xiàn)出來的區(qū)別不大。
“我們能獲得的數(shù)據(jù)非常有限,這是‘復(fù)現(xiàn)大師’的一個(gè)難點(diǎn)?!蓖踅瓭榻B,團(tuán)隊(duì)“復(fù)現(xiàn)大師”的想法最早是校長錢旭紅提出的。早在3年前,在“中國哲學(xué)社會(huì)科學(xué)國際化研究前沿”跨學(xué)科項(xiàng)目中,華東師大就首次提出了數(shù)智人概念,結(jié)合教育、管理、心理、大數(shù)據(jù)、計(jì)算機(jī)等學(xué)科基礎(chǔ)先行探索。兩年前,王江濤團(tuán)隊(duì)嘗試“復(fù)現(xiàn)”過2017年逝世的華東師大老校長袁運(yùn)開,當(dāng)時(shí)受制于數(shù)據(jù)不夠、技術(shù)不強(qiáng)等因素,“復(fù)現(xiàn)”效果一般。
那時(shí)采用的,是如今直播中普遍使用的數(shù)字技術(shù)——需要一個(gè)真人在后臺(tái)講話、做動(dòng)作,再由電腦合成聲音和形象——還不是真正運(yùn)用大模型算法的數(shù)智人。這種技術(shù),一方面對(duì)“演員”表演技術(shù)要求高,要能模擬老校長的言行舉止,另一方面對(duì)前臺(tái)數(shù)字形象制作的要求也高,很難做到“生動(dòng)”,數(shù)字形象可以說話,但無法做到與人對(duì)話。
兩年后,在蔣華良院士數(shù)智人實(shí)驗(yàn)上,王江濤團(tuán)隊(duì)要實(shí)現(xiàn)更高的目標(biāo)——不僅不再需要后臺(tái)“演員”,還要求數(shù)智人的表情生動(dòng)、自然,能夠與師生親朋實(shí)現(xiàn)“對(duì)話”。
用算法“教會(huì)”數(shù)智人“說話”
前期的研發(fā),總會(huì)出現(xiàn)這樣那樣的問題。一個(gè)數(shù)智人的推出,包括發(fā)音驅(qū)動(dòng)和形象驅(qū)動(dòng)兩個(gè)方面,哪怕只是一個(gè)細(xì)微的面部表情,都是由后臺(tái)算法時(shí)時(shí)刻刻計(jì)算出來的。
“一開始,數(shù)智人說話時(shí),身體總是在搖晃,還不會(huì)眨眼睛?!比A東師大軟件工程學(xué)院工程師徐剛負(fù)責(zé)蔣院士數(shù)智人的形象驅(qū)動(dòng)部分,他告訴記者,由于蔣院士生前視頻資料多為公開場合的講座、演講、發(fā)言等,表情相對(duì)正式,所以機(jī)器對(duì)其形態(tài)進(jìn)行學(xué)習(xí)時(shí),往往捕捉不到“眨眼睛”這個(gè)動(dòng)作。后來,團(tuán)隊(duì)成員一方面聯(lián)系家屬收集院士的日常生活視頻,另一方面修改后臺(tái)算法,解決數(shù)智人說話時(shí)眼神和身體不自然的問題。
蔣華良院士是江蘇常州人,他講話時(shí)有比較重的南方口音,這也需要后臺(tái)進(jìn)行專門的計(jì)算模擬。團(tuán)隊(duì)成員介紹,最開始的版本有些生硬,蔣院士的家人和學(xué)生都不滿意。一眼就能辨識(shí)出是“數(shù)字人”——既不逼真,也不智能。
語氣、表情、神態(tài)處理好了,下一步的難點(diǎn)是讓數(shù)智人“把話說準(zhǔn)確”。為此,研發(fā)團(tuán)隊(duì)收集了蔣院士生前大量的文字素材,內(nèi)容涵蓋其所專注的藥物專業(yè)領(lǐng)域、有關(guān)他帶學(xué)生的故事等,此外還有個(gè)人生活、業(yè)余興趣愛好等。其中,個(gè)人生活方面,華東師大專門為蔣院士召開了一場追思會(huì),由他的生前好友、同事、學(xué)生、家屬等一一回憶他的生活點(diǎn)滴和有趣的故事?!皵?shù)據(jù)收集越多,研發(fā)出來的數(shù)智人,回答問題的能力就越強(qiáng)?!蓖踅瓭f。
隨之而來的問題是,數(shù)智人在學(xué)習(xí)了大量文獻(xiàn)后,經(jīng)?!耙换卮鹁驼f個(gè)不?!?。這與蔣華良院士生前講話“言簡意賅、準(zhǔn)確到位”并不相符。
為此,給數(shù)智人的回答“設(shè)置邊界”,又被研究團(tuán)隊(duì)提上了日程。
華東師大軟件工程學(xué)院副研究員姚俊杰負(fù)責(zé)大模型的底層數(shù)據(jù)優(yōu)化,他和同事們的工作是讓數(shù)智人有認(rèn)知能力。數(shù)智人不僅要悉數(shù)掌握蔣院士的生平、事跡,還要對(duì)藥學(xué)、生物學(xué)等領(lǐng)域的相關(guān)知識(shí)了如指掌。
“一開始我們做的數(shù)智人會(huì)使用很多情緒詞,問一個(gè)問題,他會(huì)把所有相關(guān)的內(nèi)容一股腦兒地倒出來?!币〗苷f,蔣華良院士的數(shù)智人創(chuàng)新,一定程度上也是華東師大未來教師數(shù)智人的預(yù)演,“不管將來換成哪個(gè)領(lǐng)域的其他老師,都會(huì)面臨設(shè)置邊界、讓數(shù)智人把話說準(zhǔn)確的問題”。
數(shù)智人的想象和應(yīng)用空間有多大
人工智能不僅是自然科學(xué)與工程技術(shù)領(lǐng)域的問題,同樣也是人文社會(huì)科學(xué)領(lǐng)域關(guān)注的問題。
中國社會(huì)科學(xué)院科學(xué)技術(shù)和社會(huì)研究中心副主任、哲學(xué)研究所助理研究員雷環(huán)捷就預(yù)測,未來人工智能一定會(huì)驅(qū)動(dòng)人文社會(huì)科學(xué)的研究。
比如,在課程教學(xué)中,人工智能可以協(xié)助教師生成課程大綱、習(xí)題作業(yè)等教學(xué)材料,還可以答疑解惑;在人才培養(yǎng)過程中,人工智能可以幫助學(xué)生訓(xùn)練辯證、批判、創(chuàng)新等思維,形成獨(dú)立思考和解決問題的能力。在學(xué)科建設(shè)中,人工智能還能促進(jìn)新的研究方法和思路的產(chǎn)生,不僅有助于一些新興學(xué)科和交叉學(xué)科的孵化,還有助于基礎(chǔ)學(xué)科、重點(diǎn)學(xué)科、冷門學(xué)科找到新的生長點(diǎn)。
實(shí)際上,華東師大已經(jīng)在校園內(nèi)逐步嘗試“高仿真數(shù)智人(視頻)教學(xué)”,由高仿真的“教授”制作了一堂教育部產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目的數(shù)據(jù)分析課程;該校還出品了“小花獅作文智能輔導(dǎo)系統(tǒng)”,輔導(dǎo)對(duì)象為三年級(jí)到九年級(jí)中小學(xué)生,它基于大語言模型技術(shù),為上千所中小學(xué)孩子提供智能化評(píng)估及反饋。
目前,華東師大已建構(gòu)出國內(nèi)首個(gè)大模型綜合教育能力評(píng)測框架,研制出我國第一個(gè)專門面向教育領(lǐng)域的大語言模型“EduChat”。
王江濤告訴記者,無論是袁運(yùn)開校長的數(shù)智人,還是蔣華良院士的數(shù)智人,都屬于前期探索。未來,數(shù)智人的應(yīng)用場景可以在檔案館、博物館、校史館等,“可以讓歷史人物重現(xiàn),也許公眾可以和李白一起賦個(gè)詩、和魯迅來一場交流?”
再比如,學(xué)生學(xué)習(xí)英語的需求,也可以通過數(shù)智人來滿足,“現(xiàn)在一個(gè)英語老師或許只能與幾名學(xué)生充分對(duì)話、上小課,未來如果有仿真的英語系教授給孩子上課,他可以和更多的孩子實(shí)現(xiàn)‘一對(duì)一’”。
王江濤介紹,團(tuán)隊(duì)目前還在與對(duì)外漢語專業(yè)人士對(duì)接,嘗試設(shè)計(jì)一個(gè)數(shù)智人來教外國人漢語,“如果每天都有一個(gè)漢語數(shù)智人教師陪你聊天、練普通話,你的漢語水平是不是會(huì)有很大長進(jìn)?”
中青報(bào)·中青網(wǎng)記者 王燁捷 來源:中國青年報(bào)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 超九成受訪大學(xué)生喜歡“上冰雪”
- 專精特新企業(yè)營收保持較快增長
- 赴湖南督導(dǎo)冬春救助 應(yīng)急管理部工作組實(shí)地核查確保資金發(fā)放到位
- 反腐敗必須永遠(yuǎn)吹沖鋒號(hào)
- 規(guī)范零工市場扶持靈活就業(yè)
- 用心用情用力保障和改善民生(今日談)
- 加強(qiáng)研究性修繕 推動(dòng)預(yù)防性保護(hù)(深閱讀)
- 菜市場“網(wǎng)紅”之路:傳統(tǒng)農(nóng)貿(mào)市場如何轉(zhuǎn)型?
- “智慧大腦”助力改造、"城中村"成"城中景" ……這些老城區(qū)不一樣了
- 天津“新”城事丨故事,從大規(guī)模調(diào)研和討論開始——城市更新具體行動(dòng)綱領(lǐng)確立歷程