AI大模型:為產(chǎn)業(yè)智能化升級“開閘放電”
人工智能作為新一代產(chǎn)業(yè)變革的核心驅(qū)動力之一,其發(fā)展已經(jīng)從“大煉模型”逐步邁向“煉大模型”的階段。通過設(shè)計先進(jìn)的算法,整合盡可能多的數(shù)據(jù),匯聚大量算力,集約化地訓(xùn)練大模型,從而服務(wù)更多的企業(yè),正在成為人工智能發(fā)展的新趨勢。
機(jī)器人“小科”亮相國家“十三五”科技創(chuàng)新成就展、“冬奧手語播報數(shù)字人”在北京電視臺上崗。
盡管公眾對大模型的概念和它背后的技術(shù)突破還一知半解,卻已對悟道2.0大規(guī)模智能模型驅(qū)動下的這些應(yīng)用不再陌生。
2021年,北京智源人工智能研究院(以下簡稱智源研究院)發(fā)布悟道大模型,連創(chuàng)“中國首個”“世界最大”紀(jì)錄。
以此為標(biāo)志,越來越多的研究機(jī)構(gòu)、企業(yè)加入到“煉大模型”和推動智能普惠的隊(duì)伍中,在世界人工智能技術(shù)發(fā)展和應(yīng)用中貢獻(xiàn)中國智慧和力量。
“開閘放電”普惠社會
2021年6月1日,由智源研究院、清華大學(xué)等多個單位聯(lián)合打造的悟道2.0發(fā)布。其參數(shù)規(guī)模達(dá)1.75萬億,打破了之前由國外預(yù)訓(xùn)練模型創(chuàng)造的1.6萬億的參數(shù)紀(jì)錄,成為中國首個、全球最大的萬億級預(yù)訓(xùn)練模型。
智源研究院學(xué)術(shù)副院長、清華大學(xué)教授唐杰介紹,完全基于國產(chǎn)超算GPU平臺打造的悟道2.0取得了多項(xiàng)世界級的創(chuàng)新突破,在預(yù)訓(xùn)練模型架構(gòu)、微調(diào)算法、高效預(yù)訓(xùn)練框架方面實(shí)現(xiàn)了原始理論創(chuàng)新,在世界公認(rèn)的人工智能能力排名榜單上,取得9項(xiàng)能力的領(lǐng)先地位。
為提升大規(guī)模預(yù)訓(xùn)練模型的產(chǎn)業(yè)普適性和易用性,悟道團(tuán)隊(duì)搭建的高效預(yù)訓(xùn)練框架,實(shí)現(xiàn)了全鏈路的原創(chuàng)突破或迭代優(yōu)化,預(yù)訓(xùn)練效率大幅提升。
“需求多樣化與場景碎片化是AI落地普遍存在的難點(diǎn)。悟道開放平臺在快捷易用的同時,更注重解決規(guī)?;?、產(chǎn)業(yè)化AI應(yīng)用問題?!碧平鼙硎?,悟道大模型具備“低門檻+高效率+高情商”的特點(diǎn),能夠滿足不同行業(yè)和企業(yè)實(shí)現(xiàn)規(guī)?;?、產(chǎn)業(yè)化的應(yīng)用需求。任何企業(yè)、開發(fā)者拿到完全開源的悟道2.0預(yù)訓(xùn)練框架后,都可以快速部署并應(yīng)用于實(shí)際業(yè)務(wù)中。
OPPO旗下開放式對話虛擬語音助手小布,基于悟道大模型開啟的“生成式回答系統(tǒng)”,一舉解決了行業(yè)共通性的長尾問題,單條回答建設(shè)成本降低99%。
高效的機(jī)器翻譯、智能的對話客服和語音播報在電商、媒體、教育、智能硬件等領(lǐng)域已經(jīng)表現(xiàn)出極大的發(fā)展空間,驗(yàn)證了大模型鋪就的邁向通用人工智能的路徑極富潛力。
智源研究院理事長張宏江指出:“未來,大模型會形成類似電網(wǎng)的智能基礎(chǔ)平臺,像發(fā)電廠一樣為全社會源源不斷供應(yīng)‘智力源’,高效普惠各行各業(yè)?!?/p>
悟道2.0超大規(guī)模智能模型訓(xùn)練技術(shù)體系,為我國人工智能應(yīng)用構(gòu)建的基礎(chǔ)設(shè)施,已開始為傳統(tǒng)行業(yè)智能化改造和升級“開閘放電”。
打造新型研發(fā)機(jī)制
悟道大模型實(shí)現(xiàn)了我國在超大規(guī)模智能模型技術(shù)的自主可控及前沿引領(lǐng)。智源研究院院長黃鐵軍從三個角度對于研發(fā)機(jī)制給予了解釋。
一方面,是新時代“集中力量辦大事”的科研組織模式,即保持對重大科學(xué)問題的敏銳眼光,以需求導(dǎo)向和問題導(dǎo)向布局重大科研任務(wù),建立大任務(wù)快速論證啟動機(jī)制,組建跨機(jī)構(gòu)、大協(xié)同、高強(qiáng)度的科研團(tuán)隊(duì),解決大問題。另一方面,以人才為中心,鼓勵自由探索,堅持求真務(wù)實(shí)、不論資排輩的人才發(fā)展模式,堅持以“代表作”和“小同行評價”遴選人才,讓想干事、能干事的青年人才“挑大梁當(dāng)主角”。
“智源研究院立志要做‘永遠(yuǎn)年輕的研究院’,注重對青年學(xué)者的吸引,期待與青年學(xué)者共同創(chuàng)造科研新范式?!睆埡杲f,“智源推崇‘代表作文化’,不問出身,不看論文數(shù),只看是否取得標(biāo)桿性成就,有沒有成為標(biāo)桿的潛力。”
唐杰表示,未來智源研究院將繼續(xù)推進(jìn)機(jī)制創(chuàng)新,既要“頂天”,也要“立地”。在吸引更多學(xué)者加入,創(chuàng)造出更多類似悟道大模型的科研“代表作”,推動北京率先成為國際領(lǐng)先的人工智能創(chuàng)新中心的同時,打造生態(tài),連接技術(shù)與產(chǎn)業(yè),推動人工智能產(chǎn)業(yè)發(fā)展和深度應(yīng)用。
產(chǎn)學(xué)研相繼入場
站在“新三年計劃”的起點(diǎn),悟道將圍繞提智能、降門檻、建生態(tài)多個角度,進(jìn)一步向“更好用”邁進(jìn)。
隨著越來越多的研究機(jī)構(gòu)和技術(shù)公司入場,以虛擬數(shù)字人為典型代表的,基于大模型應(yīng)用的技術(shù)創(chuàng)新和產(chǎn)業(yè)成果在我國全面開花。
2021年7月9日,中國科學(xué)院自動化研究所發(fā)布跨模態(tài)通用人工智能平臺“紫東太初”,基于這個全棧國產(chǎn)化平臺,以多模態(tài)大模型為核心打造的虛擬人“小初”,圖片、文字、語音都能理解,真實(shí)呈現(xiàn)了圖片、文字、語音三種模態(tài)的關(guān)聯(lián)與協(xié)同能力,再次縮短了人工智能與人類想象力的距離。
2021年9月28日,浪潮人工智能研究院發(fā)布人工智能巨量模型——源1.0,它發(fā)布時,已幾乎讀完了近5年的中文互聯(lián)網(wǎng)浩瀚內(nèi)容。
浪潮信息副總裁劉軍表示,巨量化的一個核心特征就是模型參數(shù)多、訓(xùn)練數(shù)據(jù)量大。源1.0參數(shù)量高達(dá)2457億,訓(xùn)練數(shù)據(jù)集規(guī)模達(dá)到5000GB。
如中國工程院院士王恩東所言,讓機(jī)器像人類一樣具有邏輯、意識和推理等認(rèn)知能力,一直是計算機(jī)科學(xué)探索、研究的重要方向。在較好解決“感知智能”問題后,這輪人工智能的發(fā)展,已經(jīng)進(jìn)入通過各種創(chuàng)新解決更復(fù)雜的“認(rèn)知智能”問題的發(fā)展階段。
黃鐵軍說:“人工智能是新一代產(chǎn)業(yè)變革的核心驅(qū)動力,它的發(fā)展已經(jīng)從‘大煉模型’逐步邁向‘煉大模型’。通過設(shè)計先進(jìn)的算法,整合盡可能多的數(shù)據(jù),匯聚大量算力,集約化地訓(xùn)練大模型,供大量企業(yè)使用,是必然趨勢?!?/p>
劉 艷 付麗麗
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。