推動科技創(chuàng)新 發(fā)展語言智能
發(fā)展語言智能是推動語言文字信息技術(shù)創(chuàng)新,扶持語言產(chǎn)業(yè)發(fā)展的重要任務(wù),也是語言科技工作者的神圣使命。
增強創(chuàng)新意識
語言智能是語言文字信息技術(shù)創(chuàng)新發(fā)展的時代產(chǎn)物。發(fā)展語言智能必須增強科學(xué)意識,深刻認識語言智能的科學(xué)原理,深入研究語言智能。語言智能基于人腦生理屬性、言語認知路徑、語義生成規(guī)律,利用大數(shù)據(jù)與人工智能技術(shù),對語言信息進行標注、抽取、加工、存儲和特征分析,構(gòu)擬人機語義同構(gòu)關(guān)系,讓機器實施類人言語行為,即讓機器說話、寫作、翻譯、評測,實現(xiàn)人機語言交互。
語言智能研究應(yīng)當類腦智能和計算智能二者兼顧。從語言智能角度研究類腦智能,應(yīng)研究言語神經(jīng)元特性、神經(jīng)回路與大腦功能、神經(jīng)元運作生理屬性;探索人腦對語言符號的加工、記憶、聯(lián)結(jié)、言語情感激發(fā)和言語輸出規(guī)律;研究言語活動的問題與言語障礙治理。從人腦角度研究語言智能,難度很大,需要生命科學(xué)、腦科學(xué)、認知科學(xué)、心理學(xué)、醫(yī)學(xué)、語言學(xué)等多學(xué)科交叉協(xié)同攻關(guān)。
從計算角度研究語言智能,應(yīng)研究語言的符號標注、語音處理、文字識別、語塊疊加、句子生成、篇章生成、語義分析、情感計算、語言理解、機器翻譯、語言測評等。研究難點在于語義計算和情感計算。語義計算需要突破靜態(tài)語義多義素選擇與動態(tài)語義的不確定性計算難題,情感計算需要對多樣態(tài)語音、個性化文字、面部表情表征顆粒以及腦電心電反應(yīng)特征等進行結(jié)構(gòu)化處理與精準計算。
資源庫建設(shè)是語言智能研究的基礎(chǔ)。需要依據(jù)國家語言文字發(fā)展戰(zhàn)略,圍繞語言智能發(fā)展目標,確定資源建設(shè)任務(wù),做好頂層設(shè)計,評估建設(shè)難度,協(xié)同多方力量,分步組織實施。只有經(jīng)過科學(xué)加工的語言數(shù)據(jù)才能有效助力語言智能研究,提升語言智能研究品質(zhì)。
注重成果轉(zhuǎn)化
資源建設(shè)、理論研究和技術(shù)研發(fā)成果,最終要轉(zhuǎn)化成語言智能產(chǎn)品,為社會提供語言智能服務(wù)。
我國通用語言文字推廣普及工作取得了巨大成效,但一些偏遠貧困地區(qū)的普通話水平仍不理想,與外部地區(qū)仍存在交流困難,影響先進信息的接受,妨礙地區(qū)經(jīng)濟發(fā)展。這就需要語言智能,尤其是智能語音技術(shù),輔助提升普通話推廣的精度、速度和效率。
語言能力是人的認知力、思維力、邏輯力、創(chuàng)造力和表達力的綜合體現(xiàn)。如何提高語言能力,是對語言智能提出的挑戰(zhàn)性問題。這需要采集相應(yīng)數(shù)據(jù),科學(xué)分析個人的知識基礎(chǔ)、學(xué)科傾向、思維類型、能力潛質(zhì),分析經(jīng)驗積累和知識攝取狀況,通過智能技術(shù)手段,測評實際水準,推薦個性化知識學(xué)習(xí)內(nèi)容,并輔助個性化語言能力訓(xùn)練。
語言智能具有文化傳承的服務(wù)優(yōu)勢。語言是文化載體,語言精神反映民族精神。從浩瀚的古典文獻中精選優(yōu)秀傳統(tǒng)文化素材,從當下日新月異的語言信息洪流中洗練文化精華,傳遞給當代國人,需要語言智能獨特的算力。從既有的語言文字數(shù)據(jù)中分析發(fā)現(xiàn)文化素養(yǎng)和家國情懷,精準實施優(yōu)秀文化教育,可以成為語言智能的常態(tài)服務(wù)。
目前,語言智能服務(wù)仍處于細分領(lǐng)域的單點突破階段。發(fā)展語言智能,不但要貢獻當下,更要關(guān)注未來。應(yīng)當在基礎(chǔ)理論、關(guān)鍵技術(shù)、產(chǎn)品研發(fā)及場景應(yīng)用上持續(xù)發(fā)力,不斷開發(fā)用戶體驗良好、優(yōu)質(zhì)高效的語言智能產(chǎn)品,廣泛服務(wù)社會,服務(wù)全人類。(作者:周建設(shè) 中國語言智能研究中心主任)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
-
呵護漢字 傳承文明
世界文字類型豐富多樣,或古老,或年輕,或自源,或他源,其中漢字無疑是世界上最為獨特的文字之一。[詳細] -
語言能力建設(shè)的宗旨是服務(wù)國家發(fā)展
我國需要對世界語言及其應(yīng)用做更多研究和探討,擁有與大國地位相當?shù)恼Z言文字知識和話語權(quán)。[詳細] -
堅定不移推廣普及國家通用語言文字
我國是統(tǒng)一的多民族多語言國家,普通話和規(guī)范漢字是我國的國家通用語言文字,推廣國家通用語言文字是我國的基本語言政策。[詳細]