必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

華為發(fā)布全新AI數(shù)據(jù)基礎(chǔ)設施

2026年3月17日 18:13CCTIME飛象網(wǎng)

3月17日,在2026華為數(shù)據(jù)存儲新春發(fā)布會上,華為正式發(fā)布針對AI推理場景的全新AI數(shù)據(jù)基礎(chǔ)設施,包含面向中心推理場景的AI數(shù)據(jù)平臺,和面向分支邊緣推理場景的FusionCube A1000 AI超融合一體機,旨在推動AI推理體驗全面升級,并顯著降低推理部署門檻,加速AI商業(yè)正循環(huán)。

過去幾年,AI歷經(jīng)多輪演進,已邁入了以推理為核心的全新階段。當下,企業(yè)正面臨兩大變化:一是數(shù)據(jù)類型與規(guī)模持續(xù)擴展,從文本為主轉(zhuǎn)向多模態(tài)格式混合,體量從TB級躍升至EB級;二是企業(yè)核心資產(chǎn)從“數(shù)據(jù)”轉(zhuǎn)變?yōu)椤爸R”與“記憶”,被實時調(diào)用以支撐智能體自主決策。這些正全面重塑AI數(shù)據(jù)基礎(chǔ)設施,成為AI行業(yè)化落地的關(guān)鍵。

面向中心推理場景

華為推出AI數(shù)據(jù)平臺

為解決推理業(yè)務中知識質(zhì)量不足、長序列推理體驗差以及推理記憶缺失的三大瓶頸,華為發(fā)布AI數(shù)據(jù)平臺,整合知識庫、KV Cache加速和記憶庫,并結(jié)合UCM技術(shù)實現(xiàn)調(diào)度與管理,破除企業(yè)AI的數(shù)據(jù)門檻,加速智能體應用落地。

華為存儲產(chǎn)品線副總裁、閃存領(lǐng)域總裁 謝黎明

知識庫:實時生成知識、高精度檢索知識

企業(yè)數(shù)據(jù)在不斷變化與更新,如果知識轉(zhuǎn)化不及時,會導致模型的推理決策結(jié)果不精準。華為AI數(shù)據(jù)平臺采用端到端的解析優(yōu)化、表征優(yōu)化與檢索優(yōu)化,提供一個可敏銳捕捉源端數(shù)據(jù)變化的AI數(shù)據(jù)管道,并通過多模無損解析、Token級編碼等方式,將文本、圖片、視頻等資源轉(zhuǎn)化成海量細顆粒度的知識,結(jié)合多維度檢索與重排序,實現(xiàn)超95%知識檢索精度。

KV Cache加速:容納海量歷史數(shù)據(jù),加速推理響應

在長文本長序列、多用戶多并發(fā)的推理過程中,大量的KV Cache數(shù)據(jù)存不下、系統(tǒng)響應遲緩,導致推理體驗惡化。華為AI數(shù)據(jù)平臺針對性提供了全局分層緩存能力,讓記憶數(shù)據(jù)在On-chip memory、DRAM、外置SSD存儲三層間按需流動,顯著擴充KV Cache存儲池,同時融合多種稀疏注意力算法,避免重復計算,大幅擴展上下文窗口,實現(xiàn)首Token時延降低90%。

記憶庫:高效管理上下文記憶,讓模型越用越聰明

當前,大模型普遍缺乏持久的記憶,會遺忘多步驟的中間結(jié)果和長期沉淀的歷史經(jīng)驗,無法真正實現(xiàn)自我進化。華為AI數(shù)據(jù)平臺提供精準的記憶萃取與召回能力,實現(xiàn)上下文狀態(tài)保持、信息凝練。記得越多,推理就越精準,模型應用才能“越用越聰明”。

本次發(fā)布的AI數(shù)據(jù)平臺可提供一體化和獨立式兩大部署模式。一體化部署以OceanStor A800為全棧一體機底座;獨立式部署采用“數(shù)據(jù)引擎節(jié)點+OceanStor Dorado”架構(gòu),可在現(xiàn)有存儲系統(tǒng)上新增數(shù)據(jù)引擎節(jié)點,保護歷史投資,支撐業(yè)務平滑轉(zhuǎn)型。

面向分支邊緣推理場景

華為發(fā)布FusionCube A1000 AI超融合一體機

如今,大量的數(shù)據(jù)是在分支邊緣場景產(chǎn)生的,針對傳統(tǒng)分支邊緣場景進行智能化改造過程中所面臨的部署復雜、成本高昂、效率低下等問題,華為推出FusionCube A1000 AI超融合一體機,通過集成化與智能化交付,助力AI快速部署與高效運行。

華為存儲產(chǎn)品線副總裁、虛擬化領(lǐng)域總裁 張偉力

FusionCube A1000采用通算與智算融合一體化架構(gòu),實現(xiàn)AI部署“開箱即用”。其內(nèi)置的AI平臺預集成了數(shù)據(jù)處理、模型訓練與推理全流程能力,基礎(chǔ)設施部署與應用上線周期顯著縮短80%。同時,F(xiàn)usionCube A1000具備統(tǒng)一運維、安全運營的能力,實現(xiàn)全棧管理、健康監(jiān)測、故障快速定位定界,為智能體穩(wěn)定高效地運行提供安全保障。

此外,F(xiàn)usionCube A1000支持邊緣與中心協(xié)同運行,打破數(shù)據(jù)孤島,形成智能體從感知到自主決策的閉環(huán)。分支邊緣側(cè)產(chǎn)生的數(shù)據(jù)將回傳至中心,在中心側(cè)不斷豐富語料、完成模型增訓,模型更新后可一鍵下發(fā)至邊緣側(cè),實現(xiàn)模型能力的持續(xù)優(yōu)化與共享。同時,F(xiàn)usionCube A1000支持算力的動態(tài)切分與調(diào)度,可同時運行多個不同的AI模型,并依據(jù)業(yè)務優(yōu)先級智能分配資源,單卡算力利用率提升約30%。其內(nèi)置平臺還支持知識庫與記憶庫的協(xié)同構(gòu)建,數(shù)據(jù)飛輪無感運轉(zhuǎn),持續(xù)提升AI模型輸出的準確性與實用性。

此次發(fā)布的華為AI數(shù)據(jù)平臺與FusionCube A1000,實現(xiàn)了從中心到邊緣的AI推理全場景覆蓋,為AI技術(shù)廣泛行業(yè)化落地注入新動能。華為數(shù)據(jù)存儲將持續(xù)深耕創(chuàng)新,賦能AI全路徑,助力企業(yè)兌現(xiàn)AI商業(yè)價值。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 2026十大科技趨勢

    2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!

    [詳細]

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像