中國日報3月11日電(記者 馬思)當人們熱議大模型的算力與算法時,一個關鍵問題往往被忽視——數據從何而來,又安放何處?在全國兩會召開之際,全國人大代表、華中科技大學副校長馮丹在接受《中國日報》獨家專訪時指出,中國存儲產業部分產品已實現從追趕到領跑的歷史性跨越,成為又一國家級新名片。
"在金融、醫療、電信、能源等國計民生行業,國產高端存儲已實現替代;從存儲芯片、固態盤到存儲系統,我國已打通全產業鏈國產化閉環。"馮丹表示,"更值得一提的是,中國存儲企業開始在海外站穩腳跟,在東南亞、非洲、美洲等地區實現規模化部署。"
作為在存儲領域耕耘三十余年的學者,馮丹親歷了中國存儲產業從追趕到領跑的奮進歷程。在人工智能浪潮席卷全球的今天,她關注一個迫在眉睫的挑戰:面向AI的數據平臺建設嚴重滯后,正成為制約人工智能賦能實體經濟的"卡脖子"瓶頸。
馮丹援引《全國數據資源調查報告(2024)》的數據指出,2024年我國用于AI開發、訓練和推理的數據量同比增長40.95%,智能家居、智能網聯汽車等智能設備數據增速分別達到51.43%和29.28%,低空經濟和機器人數據生產量增速超過30%。
然而,數據需求的爆發式增長與數據平臺供給不足形成尖銳矛盾。2025年,NAND閃存價格累計上漲近2.5倍;硬盤價格在10月至11月單月增長20%。“這種供需失衡不僅推高了AI研發成本,更嚴重制約了中小企業參與人工智能創新的能力。”馮丹強調,存儲芯片的供應緊張已直接影響AI模型的訓練效率和迭代速度,亟需從國家層面統籌解決。
與此同時,大規模智算集群的建設暴露出更深層問題——缺少與算力規模相適應的數據平臺。馮丹介紹,以Meta為代表的美國科技企業建設的萬卡集群需要配置7000多節點的數據平臺,其在能耗和占地面積方面都面臨巨大挑戰。"單純追求算力規模而忽視數據平臺配套,將導致整體效率低下。"
根據中國信通院調研數據,我國已建成的智算中心中,僅有20%配備了與算力規模相匹配的數據平臺,嚴重制約了計算資源的利用效率。馮丹對此表示擔憂:"英偉達已開始與存儲廠商合作加快SCADA存算架構發展,為AI工廠配置專用數據平臺。如果我們不抓緊布局,可能在下一輪AI競爭中掉隊。"
隨著智能體在工業制造、金融服務等復雜場景的深入應用,另一個技術瓶頸浮出水面——記憶能力。馮丹指出,智能體的四大關鍵能力(感知、決策、執行、記憶)中,記憶能力已成為最突出的短板。
根據中國人工智能產業發展聯盟的測試數據,智能體在處理超過72小時連續任務時,記憶能力下降幅度達到60%以上,嚴重影響任務執行的準確性和可靠性。"目前主要依賴于HBM(高帶寬內存)的架構在成本和可擴展性方面面臨瓶頸,迫切需要新的技術突破。"
馮丹介紹,國內研究單位與企業已開始積極探索解決方案,華中科技大學等研發了存算一體技術和MRAM、PRAM、RRAM等存算一體芯片,華為、騰訊等單位開展了面向智能體的數據平臺架構創新。"但由于缺乏完善的產業生態和應用標準,這些創新成果難以大規模推廣應用。迫切需要建立統一的技術標準和協同創新機制。"
四方面建議:構建AI原生數據平臺創新體系
針對上述問題,馮丹在今年兩會提出四方面系統性建議:
一是加強政策引導,構建AI數據平臺創新發展體系。 她建議相關部委聯合制定《國家AI數據平臺發展專項行動》,在長記憶存儲、新型閃存存儲器等核心技術上持續迭代,達到國際先進水平。同時,在"雙一流"高校設立相關專業方向,培養碩士及博士等專業人才;在職業院校開設數據平臺運維專業,培養技能型人才;建立若干個國家級實訓基地促進產教融合。多措并舉,滿足企業每年2萬人左右的人才缺口。
二是統籌AI基礎設施建設,推進算存網電高效協同。 馮丹建議建設3-5個融合型AI基礎設施示范基地,升級數據中心機房配套,部署超節點集群,加快EB級超節點存儲技術推廣應用。同時建立全國統一的AI基礎設施調度平臺,實現跨區域算存網資源協同共享。
三是培育數據平臺開源生態,增強產業自主發展能力。馮丹建議建立國家級數據平臺開源社區,設立開源項目孵化基金,重點支持優質開源項目。鼓勵高校和研究機構在發表論文同時將技術開源,發布在開源社區;鼓勵企業參與數據平臺技術開源,對核心貢獻企業給予稅收優惠和政策支持。
四是支持技術出海,打造全球競爭新優勢。 馮丹特別強調,要支持企業在"一帶一路"沿線國家建設時優先采用國產數據平臺及開源技術,建立海外示范應用基地。"中國存儲已經成為IT技術出海的新名片,我們要讓這張名片擦得更亮。"