今天(24日),在第七屆數字中國建設峰會上,《全國數據資源調查報告(2023年)》正式發(fā)布。這是我國首次對數據資源進行“全面體檢”。根據國家數據局等多部門的最新調查結果,我國數據生產的規(guī)模優(yōu)勢基本形成。
我國數據年產量相當于千萬個國圖的數字館藏
2023年,全國數據生產總量達到32.85澤字節(jié)(ZB),這相當于1000多萬個中國國家圖書館的數字資源總量。和2022年相比,我國數據年產量增長22.44%,其中,和智能網聯汽車相關的出行數據,同比增幅達到49%;和工業(yè)機器人等智能生產設備相關的制造數據,同比增幅為20%。今年,預計我國數據生產量增長將超過25%。
國家工業(yè)信息安全發(fā)展研究中心主任 蔣艷:隨著5G、AI技術的快速發(fā)展,內容制作、影像視聽等民生消費領域的新的業(yè)態(tài)不斷涌現,隨之帶來的非結構性數據對我國數據總規(guī)模的貢獻是巨大的。
與此同時,調查發(fā)現:在2023年全年生產的數據量中,只有2.9%被存儲,這意味著一些數據在源頭就被拋棄;另外,在存儲數據中,一年未使用的數據占比約為四成,這說明不少數據被存儲后不再被讀取和復用。
北京交通大學信息管理理論與技術國際研究中心教授 張向宏:數據生產多、存儲少,這是一個全球的普遍規(guī)律,數據就像我們的水果一樣,容易腐爛而會失去價值。當然從另一方面也說明,我國在數據資源開發(fā)利用方面還有待于進一步提高。
算力規(guī)模增長快 智能算力占比約30%
算力,被稱為人工智能的“發(fā)動機”,是新質生產力。新出爐的《全國數據資源調查報告(2023年)》顯示,我國算力規(guī)模增長快,大模型計算需求不斷增加。
到2023年年底,全國2200多個算力中心的算力規(guī)模約為230百億億次浮點計算/秒(EFLOPS)。什么概念?這可以讓100輛新車的上萬次碰撞測試在1分鐘內完成。在過去的2023年,全國算力規(guī)模同比增長約為30%。目前,在所有算力中,智能算力占比提高到約30%。
中央財經大學中國互聯網經濟研究院副院長 歐陽日輝:智能算力的需求增長這么快,主要來自大模型的發(fā)展,我們的通用大模型發(fā)展很快,行業(yè)的垂直的這種大模型發(fā)展也很快。比如說,我們在金融行業(yè)、醫(yī)療行業(yè)、政務領域里面,對智能大模型和智能算力的需求是越來越大。
在算力的區(qū)域分布上,最新調查結果顯示,京津冀、長三角、珠三角地區(qū)的算力規(guī)模占比達到近60%,東部地區(qū)的數據存儲和計算利用率要高于西部地區(qū)。
2023年我國公共數據開放量同比增長16%
公共數據,是數據領域中最大的“富礦”。《全國數據資源調查報告(2023年)》顯示,我國公共數據開放共享已經初見成效。
2023年,我國公共數據開放量同比增長16%;省級政府開放數據量比2022年增長18.5%。北京、浙江、上海、重慶等15個地區(qū)的省級數據管理部門開始探索“公共數據授權運營機制”,就是把公共數據拿出來,授權給相關企業(yè),形成公共數據產品,向社會提供服務。
中央財經大學中國互聯網經濟研究院副院長 歐陽日輝:我們看到公共數據對外開放的量增速非??欤部梢钥吹焦矓祿@取的渠道和場景越來越豐富。
今年以來,記者注意到,不少地方紛紛成立“數據集團”,加快盤活公共數據。不過整體來看,現有的數據供給難以滿足當下旺盛的需求,例如,在數據交易機構中,消費民生領域數據產品購買方數量是供給方的2.4倍。
國家工業(yè)信息安全發(fā)展研究中心主任 蔣艷:隨著數據技術快速發(fā)展,數據基礎制度不斷完善,數據產業(yè)發(fā)展壯大,數據資源開發(fā)利用水平不斷提升,供需不匹配的現象將在一定程度上得以緩解。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。