必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

共筑堅實智算底座,加速行業(yè)智能化

2025年5月17日 18:55CCTIME飛象網

2025年世界電信和信息社會日智算產業(yè)創(chuàng)新發(fā)展專題研討會,華為昇騰計算業(yè)務副總裁王慶文發(fā)表 “共筑堅實智算底座,加速行業(yè)智能化” 主題演講,深度解讀 AI 產業(yè)趨勢、運營商算力基礎設施建設與行業(yè)智能化發(fā)展路徑。

當前,AI推理市場需求呈現(xiàn)爆發(fā)式增長。Gartner 預測,未來兩年 80% 中國企業(yè)將部署生成式 AI,60% 會將 AI 融入產品服務,標志著企業(yè)AI應用從通用場景向核心生產場景滲透的 “奇點時刻” 到來,企業(yè) AI 部署已進入全面深化階段。運營商憑借領先的泛在多級訓推資源,既能滿足中小企業(yè)的靈活需求,也能支撐大型企業(yè)核心業(yè)務及海量用戶場景,并通過多租戶部署技術,保障大租戶資源獨立、中小租戶性能提升的同時全方位確保數(shù)據安全。

昇騰從基礎硬件、算子到推理系統(tǒng)全面創(chuàng)新,面向不同的推理場景需求,為包含運營商在內的客戶及伙伴提供集高性能、高可靠、易部署、開源開放于一體的推理解決方案。

面向大型企業(yè)、C端超級應用等需要大規(guī)模推理算力資源的場景,高并發(fā)、低時延下的吞吐性能是關鍵。昇騰國內首創(chuàng)大規(guī)模專家并行集群推理方案:通過將MoE模型的多專家權重數(shù)據 分散部署到更多的卡上,降低單卡權重加載時延,讓模型解碼輸出更快;單卡內存容量占用的降低,也能夠支持更大用戶并發(fā)所需的KV緩存,實現(xiàn)系統(tǒng)的更大吞吐性能,平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運營商構筑高性能的AI算力基礎設施,為行業(yè)客戶帶來更優(yōu)的業(yè)務體驗。

面向中小企業(yè)、學校和醫(yī)院等機構需要快速部署、快速落地AI應用的需求,昇騰使能運營商打造大模型應用一體機。打包量化、調優(yōu)等工具鏈顯著提升50%部署效率,通過MLA(Multi-Head Latent Attention)親和等特性,提升吞吐性能90%,從模型部署到應用上線實現(xiàn)“即開即用”,降低AI部署門檻,幫助運營商賦能千行萬業(yè)智能化轉型。目前已有超140家合作伙伴基于昇騰發(fā)布大模型應用一體機產品,為各行業(yè)場景提供廣泛的智能應用。

算力正從技術要素轉化為產業(yè)升級的核心驅動力!皢文静怀闪,眾木自成春”,昇騰將致力于打造堅實的算力底座,攜手運營商及ISV等產業(yè)伙伴破解算力供給與場景落地的關鍵挑戰(zhàn),加速 AI 在千行萬業(yè)的落地應用,為產業(yè)融合升級注入強勁動能。

編 輯:孫秀杰
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像