徐邁:為5G高速路造出適配的“車”
無論是當年的3G,還是現(xiàn)在的5G,它們都是信息基礎設施,就像“高速公路”。如果這條“高速路”上沒有與之匹配的“車”,即沒有合適的媒介內(nèi)容,就成了大材小用。而我和團隊所做的基于感知的視頻編碼研究,就是為“高速路”制造出規(guī)格合適的“車”。
2006年,在英國帝國理工學院攻讀博士學位的徐邁買到了自己的第一部3G手機。那時,中國還沒有3G網(wǎng)絡,徐邁想搶先在異國體驗一下,卻發(fā)現(xiàn)常用的多媒體業(yè)務無法在3G網(wǎng)運行,導致使用體驗和2G基本無異,于是他果斷選擇了退貨。
前不久,以北京航空航天大學教授身份獲得第二十四屆中國科協(xié)求是杰出青年成果轉(zhuǎn)化獎的徐邁,在談起這段往事時說:“無論是當年的3G,還是現(xiàn)在的5G,它們都是信息基礎設施,就像‘高速公路’。如果這條‘高速路’上沒有與之匹配的‘車’,即沒有合適的媒介內(nèi)容,就成了大材小用。而我和團隊所做的基于感知的視頻編碼研究,就是為‘高速路’制造出規(guī)格合適的‘車’?!?/p>
經(jīng)過二十余年的深耕,這位在5G多媒體領域取得了諸多研究成果的“造車匠”,近日向科技日報記者介紹了自己的學術經(jīng)歷和研究成果。
喜歡科研探索帶來的興奮感
1999年,徐邁考入北京航空航天大學,選擇了通信工程專業(yè)?!斑x擇這個專業(yè)的理由很簡單,就是因為它非?;稹<由衔冶緛砭拖矚g工科,這個選擇就是順理成章?!彼貞浀?。
完成本科學業(yè)后,徐邁又在清華大學攻讀了碩士學位。碩士畢業(yè)時,徐邁面臨人生中一個重要選擇:是去公司工作、還是做科研繼續(xù)讀博?和許多畢業(yè)生一樣,徐邁無法立刻做出決定,為此他還咨詢了清華大學教授張林。
張林從自身經(jīng)驗出發(fā)告訴徐邁:如果他想從事創(chuàng)造性的工作,繼續(xù)讀博就是合適的選擇。
徐邁喜歡科研探索帶來的興奮感,最終決定前往帝國理工學院攻讀博士學位。在倫敦讀博期間,他得到了人工智能和機器視覺領域?qū)<椰旣悂啞け说敏數(shù)闹笇?。畢業(yè)之后,徐邁回到清華大學從事博士后科研工作,開始在基于感知的視頻編碼技術領域深耕。
選擇這一方向,源于徐邁一直秉持的原則:搞科研要面向國家重大需求?!敖鉀Q國家、社會急需解決的問題,自然更容易取得成果,以及更大的社會效益。”他說。
回顧自己的科研生涯,徐邁最想感謝的人,就是給予他學術方向指導的導師們。此外,徐邁還特別感激時代和社會給他的機遇。
讓算法模擬人眼處理信息的方式
時間回到2G時代——2003年。那時,曾有位技術專家大膽預言,未來某一天人們可以用手機觀看網(wǎng)絡視頻。當時,許多人都將其視為異想天開。然而,在近二十年后的今天,觀看短視頻、網(wǎng)上直播已經(jīng)成為人們?nèi)粘I畹囊徊糠帧?/p>
“這就是從2G時代到5G時代最直觀的變化?!毙爝~解釋道,“‘道路’拓寬了,路上跑的‘車’也就不一樣了。最初是文字,后來有了可以下載的視頻,然后是流媒體,如今是短視頻和直播……基礎設施的升級為媒介形態(tài)的翻新提供了可能性,‘路’和‘車’齊頭并進,這就是通信技術發(fā)展的基本脈絡?!?/p>
信息通信技術的進步,帶來了更快的網(wǎng)速和更大的帶寬容量,但人們的需求也在與日俱增。在5G時代,人們不僅希望收看超高清視頻,還開始暢想多視角乃至全景式沉浸體驗。此外,隨著社會經(jīng)濟的發(fā)展,接入網(wǎng)絡的用戶也越來越多。在這些需求面前,如果不能控制好“車”的大小、數(shù)量,即使是5G這樣寬闊的“路”也會不夠用。
徐邁及其團隊成員的主要工作,就是通過節(jié)省碼率、降低復雜度,用智能計算方法控制視頻的大小。讓同等清晰度的視頻“體積”更小,或讓同等“體積”的視頻更清晰。
在過去十年的技術攻關中,徐邁帶領團隊成員建立起視頻計算與通信融合新架構(gòu),節(jié)省碼率超60%、降低復雜度超50%。他結(jié)合案例向記者介紹,一家中等規(guī)模的網(wǎng)絡視頻公司,只要節(jié)省10%的碼率,就可以節(jié)約上千萬元的帶寬租用成本,此外更加流暢、清晰的視頻體驗也會為該公司贏得更多用戶。
此外,基于感官的視頻編碼,即通過算法模仿人類感知系統(tǒng)節(jié)約視頻碼率,也是徐邁團
隊的研究方向之一?!澳壳把芯克悸酚袃蓚€,一是讓算法模擬人類的視覺處理系統(tǒng),通過預測人的關注點,模糊關注點以外的信息,從而減少視頻信息負載;二是讓算法模擬人類的先驗知識,即通過結(jié)構(gòu)信息構(gòu)建完整圖像的能力?!毙爝~介紹道。
“有研究表明,人類視網(wǎng)膜上神經(jīng)節(jié)細胞的視覺傳輸帶寬約為8兆。人眼用這么少的帶寬,就可以傳輸如此豐富的信息,這和人類視覺處理系統(tǒng)的機理是分不開的。我們的目標就是讓算法向人類學習,模擬人眼的信息處理方式,從而大大降低視頻的信息負載?!毙爝~總結(jié)道。
重視對學生的培養(yǎng)和幫助
作為一名大學老師,徐邁不僅要搞科研還要帶學生。徐邁在學生時代曾得到過眾多老師的幫助,而今自己成為一名教師,他十分重視對學生的培養(yǎng)和幫助。
“學生申請到了好學校,比我當初自己申請成功還開心?!毙爝~感慨道。
回憶起自己曾指導過的多位碩士研究生,徐邁說,他們都具有很強的科研能力,其中有人前往牛津大學、帝國理工學院、蘇黎世聯(lián)邦理工學院等國際名校繼續(xù)深造,也有人在中國科學院等國內(nèi)科研機構(gòu)或頭部互聯(lián)網(wǎng)公司工作,而且已有多位學生成為科研院所或商業(yè)公司的骨干人才。
徐邁回憶道,自己曾推薦一位學生出國讀博,后來他收到了來自這位學生的博士生導師的感謝信,信中肯定了該學生的科研和學習能力,這件事讓徐邁充滿了成就感。
“我一個人的力量有限,只能帶領一支團隊做事。但如果我能培養(yǎng)出一批人,讓他們都帶領自己的團隊去服務國家戰(zhàn)略需求、社會經(jīng)濟建設,就等于把我工作的意義擴大了十倍、百倍。”徐邁說。
目前,在多媒體領域,我國的技術開發(fā)、標準制定處于世界領先水平,但是在基礎理論方面和發(fā)達國家還有一定差距。徐邁認為,這一短板可能會造成我國在技術迭代中處于被動位置?!霸趯淼目蒲泄ぷ髦校瞬排囵B(yǎng)、基礎研究都是重中之重。要想讓‘信息高速公路’保持暢通、先進,需要一代代科研人員的薪火相承與不斷奮斗?!彼f。
孫明源
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。