人工智能聲吶眼鏡可識(shí)別唇語
人工智能聲吶眼鏡可識(shí)別唇語
準(zhǔn)確率約為百分之九十五
【總編輯圈點(diǎn)】
科技日?qǐng)?bào)北京4月9日電 (記者張佳欣)美國康奈爾大學(xué)研究人員開發(fā)了一款聲吶眼鏡,它通過聲學(xué)感應(yīng)和人工智能跟蹤嘴唇和嘴巴的動(dòng)作,可連續(xù)識(shí)別多達(dá)31條無聲的命令,該系統(tǒng)可為那些暫時(shí)不方便說話或無法發(fā)聲的人提供幫助。相關(guān)論文將在本月于德國漢堡舉行的計(jì)算機(jī)協(xié)會(huì)計(jì)算系統(tǒng)人為因素會(huì)議上發(fā)表。
這款眼鏡是一種名為EchoSpeech的無聲語音識(shí)別接口。該眼鏡配備了一對(duì)麥克風(fēng)和比鉛筆橡皮擦還小的揚(yáng)聲器,成為一個(gè)可穿戴的人工智能驅(qū)動(dòng)的聲吶系統(tǒng),在面部發(fā)送和接收聲波,并感知嘴巴的運(yùn)動(dòng)。然后,深度學(xué)習(xí)算法實(shí)時(shí)分析這些回聲輪廓,準(zhǔn)確率約為95%。這款低功耗、可穿戴的眼鏡只需要幾分鐘的用戶訓(xùn)練數(shù)據(jù),即可識(shí)別命令并可在智能手機(jī)上運(yùn)行。
EchoSpeech可用于在說話不方便或不合適的地方通過智能手機(jī)與他人交流,比如在嘈雜的餐廳或安靜的圖書館里。無聲語音界面還可與觸筆配對(duì),并與CAD等設(shè)計(jì)軟件一起使用,幾乎不需要鍵盤和鼠標(biāo)。
研究人員表示,他們正在將聲吶技術(shù)“搬”到人體上。它體積小、功耗低、對(duì)隱私敏感,這些都是在現(xiàn)實(shí)世界中部署新的可穿戴技術(shù)的重要功能。無聲語音識(shí)別中的大多數(shù)技術(shù)都局限于一組選定的預(yù)定命令,需要用戶面部或佩戴攝像頭,這既不實(shí)用也不可行??纱┐魇綌z像頭也存在重大的隱私問題,對(duì)用戶和與之互動(dòng)的人來說都是如此。而像EchoSpeech這樣的聲學(xué)傳感技術(shù)消除了對(duì)可穿戴式攝像機(jī)的需求。
此外,由于音頻數(shù)據(jù)比圖像或視頻數(shù)據(jù)小得多,因此EchoSpeech只需更小的帶寬,通過藍(lán)牙實(shí)時(shí)傳輸?shù)街悄苁謾C(jī)上,且數(shù)據(jù)在本地,不在云端,確保了敏感隱私信息安全。
今年以來,人工智能再次引發(fā)極大關(guān)注。幾年前,專家們還在探討如何讓人工智能更加準(zhǔn)確地理解人的意圖,并與人進(jìn)行多輪對(duì)話。曾經(jīng),讓人工智能讀懂唇語,還只是科幻電影中的橋段。如今,這些都在快速變?yōu)楝F(xiàn)實(shí)。面對(duì)人工智能帶來的超乎預(yù)期的變化,不能停留在“看熱鬧”階段,人們需要真正去思考,如何更好地主宰人工智能,利用它為人類造福,并盡量規(guī)避它可能帶來的麻煩。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 智慧平臺(tái)助執(zhí)法 城市管理更精細(xì)(基層治理新實(shí)踐)
- 我國海相深層頁巖氣勘探再獲突破
- 武漢推動(dòng)新就業(yè)群體融入城市(一線探民生)
- 我國構(gòu)建世界首個(gè)番茄超泛基因組
- 蘇州旅游打卡新標(biāo)配!竹筒奶茶走紅,有店家日銷超1000杯
- 突破多項(xiàng)關(guān)鍵技術(shù) “吉祥鳥”直升機(jī)AC332展翅高飛
- 嚴(yán)懲網(wǎng)絡(luò)暴力“按鍵傷人”(人民時(shí)評(píng))
- 為改善環(huán)境空氣質(zhì)量 山西晉城城區(qū)禁止露天燒烤
- 可敬的志愿服務(wù)精神(民生觀)
- 一季度中國鐵路完成固定資產(chǎn)投資1135.5億元 同比增6.6%