
在數字經濟蓬勃發展的時代背景下,數據作為基礎性戰略資源和關鍵生產要素,數據要素價值釋放成為推動經濟社會高質量發展的核心動力。然而,一方面相較于逐年遞增的數據產量,存力規模增速略顯滯后,數據“應存未存”現象依然存在。另一方面,數據作為AI三大核心要素之一,其規模與質量直接影響AI技術應用與發展。在此背景下,先進存力中心應運而生,作為新型信息基礎設施的重要組成部分,對于數據資源積累、數據資產轉化、數據資本流通以及促進數字經濟與實體經濟深度融合具有深遠意義。
近日,中國信息通信研究院(簡稱“中國信通院”)云計算與大數據研究所在2025中國算力大會先進數據存力論壇上發布《先進存力中心研究報告(2025年)》,中國信通院云計算與大數據研究所總工程師郭亮對報告進行了深入解讀。
報告從基礎設施建設、數據價值釋放、產業應用賦能的全局視角出發,以新型信息基礎設施演進為主線,分析當前AI發展對大規模高質量數據需求與數據“應存未存”之間的結構性矛盾,闡述先進存力中心運用“1+4+N”架構體系在破解多源異構數據匯聚、治理、流通、利用全生命周期瓶頸中的樞紐作用。提出以全閃化存力底座、跨域數據編織、存儲內生安全、AI數據湖存儲、數據分級治理、可信數據空間等關鍵技術為支撐,實現“規模聚數、高效治數、安全供數、產業用數”的數據價值閉環。同時,在新型信息基礎設施體系中,先進存力中心可為算力中心持續供給高質量數據資源,形成“以存匯數、以數促算、以算興業”的發展范式,助力我國在全球數據競爭中搶占戰略制高點。
報告核心觀點 1. 先進存力中心是以先進存力為底座,可提供數據從匯聚到應用的全周期服務能力的新型基礎設施。具體而言,先進存力中心是集先進存儲設備、數據資源管理和數據安全防護等于一體,融合數據治理、開發流通等功能的新型基礎設施。先進存力中心具備高可靠、高性能、高安全、綠色低碳等特征,提供數據托管、數據治理、數據供給與流通、數據開發與加工等服務能力,可實現規模聚數、高效治數、安全供數、產業用數,可為算力中心、大模型及數據交易提供高質量、高可信、高可用的數據供給,支撐數字經濟創新。
先進存力中心定義與特征 來源:中國信通院
2. 建設先進存力中心是破解當前我國數據“應存未存”困局的有效途徑之一。當前我國面臨數據存儲能力與生產規模不匹配的嚴峻挑戰。2024年數據顯示,全國數據年產量達41.06ZB,但存儲總量僅為2.09ZB,數據留存率由2023年的2.89%降至2.80%。先進存力中心通過實現多源異構數據的高效匯聚與安全存儲,為優化數據資源配置、避免高價值數據流失提供重要支撐。 3. 先進存力中心利用AI數據湖存儲技術實現多源多模態數據統一歸集,為我國數字經濟發展積累充分數據資源。先進存力中心以AI數據湖存儲作為先進存力底座,可實現多源異構數據的統一采集與預處理,支持結構化、半結構化及非結構化數據的批量同步與實時接入。在數據入湖階段執行標準化映射與敏感字段脫敏標記,以分區分表形式存儲于文件系統與數據庫構成的湖倉一體架構。同步實現元數據自動捕獲、注冊與血緣構建,形成“數據-元數據-目錄”一體化管理體系,為數據治理與授權加工提供可追蹤、可審計的資源基礎。 4. 先進存力中心可將數據資源有效轉化為行業高質量數據集,為打造人工智能強國夯實數據基礎。先進存力中心利用高效數據歸集和存儲能力,依托數據清洗、標注、特征融合等平臺工具,將原始數據轉化為具有行業特征的高質量數據集,為算力資源高效利用提供數據保障。同時,可采用存算資源協同調度為算力中心提供低延遲、高吞吐的訓練數據流,充分發揮我國算力資源建設優勢。 5. 先進存力中心通過統一標準、質量控制、脫敏及血緣管理,將原始數據轉化為可審計、可授權的數據資產。先進存力中心在治理階段依據統一的數據標準、模型和分層分類規范,對入湖原始數據進行字段級盤點、標準化映射、質量校驗、脫敏處理和血緣注冊,形成可檢索、可授權、可計量、可審計的高質量數據集,并同步生成數據資產目錄,為后續合規流通和價值釋放提供可信依據。
報告目錄 一、先進存力中心建設背景 (一)數據成為數字經濟發展新階段戰略資源 (二)數據留存率與存力建設水平仍有待提升 二、先進存力中心定義與內涵 (一)先進存力中心定義內涵 (二)先進存力中心服務能力 (三)先進存力中心產業定位 (四)先進存力中心運營模式 三、先進存力中心建設意義 (一)多源多模態數據資源高效匯聚 (二)助力數據要素價值進一步釋放 (三)為算力中心提供數據資源保障 四、先進存力中心關鍵技術 (一)全閃存儲架構建設,突破數據應用效能瓶頸 (二)數據編織可視可管,打破分散數據孤島效應 (三)虛擬資源智能調度,滿足數據高效流通利用 (四)數據存儲內生安全,保障數據資產高可用性 (五)AI數據湖存儲技術,實現多源數據統一歸集 (六)全域數據分級歸類,強化數據資源高效治理 (七)構建可信數據空間,促進數據資產供給流通 (八)數據挖掘與AI賦能,夯實行業數智轉型基礎 五、先進存力中心應用場景 (一)行業高質量數據集構建,構筑企業全域知識運營基座 (二)醫療影像共享空間建設,打造影像數據共享管理中樞 (三)智能網聯汽車數據管理,促進新能源產業數字化轉型 (四)公共數據授權運營開放,建設數據要素托管流通樞紐 (五)城市全域數據匯聚治理,形成民意感知研判響應閉環 六、發展建議 (一)加強國家頂層規劃,統籌先進存力中心建設布局 (二)鼓勵技術研發攻關,推進存力與算力的協同創新 (三)完善存力建設體系,保障基礎設施可持續性發展 (四)牢筑人才培育根基,支撐數據存力產業生態建設
網上經營許可證號:京ICP備18006193號-1
copyright?2005-2022 www.jzhyl.com all right reserved 技術支持:杭州高達軟件系統股份有限公司
服務熱線:010-59231580