西班牙巴塞羅那2026年3月9日 /美通社/ -- 在2026年巴塞羅那世界移動通信大會(MWC)華為產(chǎn)品與解決方案發(fā)布會上,華為數(shù)據(jù)存儲產(chǎn)品線總裁袁遠(yuǎn)正式發(fā)布華為AI數(shù)據(jù)平臺。該平臺融合知識生成與檢索、推理加速KV緩存、記憶萃取與召回、統(tǒng)一緩存管理器(UCM)等技術(shù),打通模型與商業(yè)價值之間的轉(zhuǎn)化鏈路。
盡管AI技術(shù)發(fā)展迅猛,但多數(shù)AI模型尚未深度融入核心業(yè)務(wù)。這一問題的主要癥結(jié)在于行業(yè)更側(cè)重模型訓(xùn)練,而非推理環(huán)節(jié),而推理正是模型落地的關(guān)鍵。同時,推理過程中存在的AI幻覺、響應(yīng)速度慢、吞吐量受限等痛點,也亟待通過優(yōu)化數(shù)據(jù)處理能力來解決。
針對上述挑戰(zhàn),華為數(shù)據(jù)存儲正式推出"3+1"AI數(shù)據(jù)平臺:
通過多模態(tài)無損解析與Token級編碼,將多模態(tài)資源轉(zhuǎn)化為高精度知識,檢索準(zhǔn)確率超95%
對KV緩存進行智能分層與管理,大幅擴展上下文窗口,減少重復(fù)計算,使首令牌生成時間(TTFT)縮短90%,顯著提升AI響應(yīng)速度
可精準(zhǔn)提取歷史數(shù)據(jù)與經(jīng)驗,并積累為可召回記憶。該記憶機制讓模型越用越智能。
通過三級緩存對內(nèi)存數(shù)據(jù)進行管理,實現(xiàn)對知識庫、KV緩存和記憶庫的智能調(diào)度。
在部署模式上,華為AI數(shù)據(jù)平臺提供兩種選擇:針對全新建設(shè)場景的一體機模式,基于OceanStor A800系統(tǒng)打造,可保障極致性能與靈活的擴展能力;針對存量系統(tǒng)升級場景的獨立部署模式,采用"AI數(shù)據(jù)引擎節(jié)點+ OceanStor Dorado存儲"的架構(gòu),企業(yè)可通過新增數(shù)據(jù)引擎節(jié)點完成現(xiàn)有系統(tǒng)升級,既保護了前期投資,又能實現(xiàn)業(yè)務(wù)的AI平滑轉(zhuǎn)型。
袁遠(yuǎn)表示:"華為將持續(xù)深化技術(shù)創(chuàng)新,以AI數(shù)據(jù)平臺為橋梁,推動AI模型能力轉(zhuǎn)化為真正的商業(yè)價值。"
聯(lián)系人:Zoe Yin,電郵:yinzijun@huawei.com