首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

華為云CTO張宇昕:實現(xiàn)系統(tǒng)性創(chuàng)新,構建智能世界云底座

2023年9月21日 13:49  CCTIME飛象網(wǎng)  

9月21日,華為云CTO張宇昕在華為全聯(lián)接大會2023主題演講中表示,大模型重塑千行萬業(yè)的背后,是眾多復雜的技術挑戰(zhàn),需要核心技術的持續(xù)創(chuàng)新和突破。華為云以全局的系統(tǒng)性創(chuàng)新,不斷攻堅克難,構建AI時代最佳云底座。

華為云CTO張宇昕

張宇昕指出,隨著大模型出現(xiàn)能力涌現(xiàn)、多模態(tài)融合、MOE等趨勢,模型參數(shù)將從現(xiàn)在的5400億很快超過數(shù)萬億,對海量的穩(wěn)定算力、大規(guī)模并行訓練、以及整體的架構設計都提出了更高要求;同時,數(shù)據(jù)集規(guī)模和Token長度的激增也將帶來新的挑戰(zhàn)。這些挑戰(zhàn)相互影響、環(huán)環(huán)相扣,可以說大模型及相關應用是迄今為止最復雜的軟硬件系統(tǒng)工程。

為應對AI時代的挑戰(zhàn),華為云實現(xiàn)了軟硬件結合的系統(tǒng)性創(chuàng)新:

在系統(tǒng)架構層,華為云QingTian架構全新升級分布式QingTian架構,通過打破計算、存儲、網(wǎng)絡的邊界,把過去主從式架構升級為對等架構,極大地提升了AI算力。

基于分布式QingTian架構,華為云昇騰AI云服務提供了算力集群、計算引擎CANN、AI開發(fā)框架MindSpore和AI開發(fā)平臺ModelArts,為大模型和AI應用的開發(fā)、運行提供最佳算力服務。

在數(shù)據(jù)處理層,華為云提供云上全流程一站式能力,包括數(shù)據(jù)存儲、分析、共享、標注方案,讓企業(yè)實現(xiàn)大模型數(shù)據(jù)“找得到”“存得下”“記得住”“用得了”。

在AI云存儲方面,華為云獨創(chuàng)了具備220TB超大帶寬和微秒級超低時延的內(nèi)存服務EMS,以此支持NPU/GPU的內(nèi)存擴展,可以容納PB級超大規(guī)模參數(shù),讓參數(shù)存得下;同時,基于SFS Turbo文件存儲的大并發(fā)、高吞吐緩存服務,可提供千萬級IOPS,將10億條數(shù)據(jù)和元數(shù)據(jù)的準備時間從100小時縮短至5小時,讓數(shù)據(jù)準備速度快;此外,基于OBS對象存儲構建的低成本大容量知識湖服務,通過深度歸檔、智能存儲分級和存儲管理統(tǒng)計平臺實現(xiàn)數(shù)據(jù)精細化管理,數(shù)據(jù)和向量的存儲TCO降低30%,讓海量數(shù)據(jù)存得起。

作為大模型的“超級外腦”,向量數(shù)據(jù)庫是AI時代的剛需產(chǎn)品。華為云GaussDB向量數(shù)據(jù)庫具備千億級大規(guī)模向量數(shù)據(jù)快速查詢更新的能力,檢索規(guī)模提升10倍,查詢時延<10ms,響應速度提升2倍。另外,GaussDB向量數(shù)據(jù)庫具有千維查詢能力,查詢結果更精準,助力企業(yè)業(yè)務更智能。

數(shù)據(jù)是大模型的源泉,華為云數(shù)智融合平臺通過統(tǒng)一的數(shù)據(jù)資源和元數(shù)據(jù)技術LakeFormation等四大關鍵技術為大模型提供更高效、高質(zhì)量的數(shù)據(jù)底座。同時,華為云全新發(fā)布智能數(shù)據(jù)洞察產(chǎn)品DataArts Insight,對數(shù)據(jù)資產(chǎn)進行了語義擴展和領域知識關聯(lián),讓大模型在消費階段的調(diào)優(yōu)和推理效率倍增。

為了給大模型高質(zhì)量“供數(shù)”、讓大模型高安全“用數(shù)”,華為云推出了高質(zhì)量、高安全的數(shù)據(jù)要素流通解決方案:基于TICS隱私計算和區(qū)塊鏈BCS服務,提供可信數(shù)據(jù)開發(fā)環(huán)境,幫助客戶把高價值數(shù)據(jù)變成高質(zhì)量數(shù)據(jù)集產(chǎn)品,實現(xiàn)可用不可見、全流程可溯。EDS交換數(shù)據(jù)空間支持20多種控制策略,讓數(shù)據(jù)在授權范圍內(nèi)可信地流通。

此外,為了給大模型訓練打造安全高效的AI標注環(huán)境,華為云推出AI標注云桌面,讓分散在各地的標注員可以遠程接入;敏感數(shù)據(jù)始終保存在云端安全專區(qū),滿足安全合規(guī)的要求;同時,云端實時加載,結合華為云HDP高清顯示協(xié)議毫秒級傳輸,實現(xiàn)圖像本地顯示時延降低50%以上。

在模型訓練層,華為云通過盤古大模型的“5+N+X”的架構實現(xiàn)分層解耦,賦能千行萬業(yè),讓每個行業(yè)、每個企業(yè)基于自己的場景都可以擁有自己的大模型。盤古大模型L0層提供了5個基礎大模型,包括自然語言大模型、視覺大模型、多模態(tài)大模型、預測大模型、科學計算大模型,提供滿足行業(yè)場景的多種技能;L1層包括N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型,也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型L0或L1層基礎上,為客戶訓練自己的專有大模型;L2層為客戶提供更多專注于具體應用場景或特定業(yè)務的模型,提供開箱即用的模型服務。

在應用開發(fā)層,華為云整合了應用開發(fā)需要的開發(fā)生產(chǎn)線、低碼/無碼平臺、AI應用框架及全新的AI應用工程套件,讓客戶輕松實現(xiàn)基于大模型的AI原生應用的零門檻構建。

例如,大模型應用既需要多樣化的AI原生技術,又需要強大的工程能力,同時也要具備小顆粒、敏捷部署能力。為此華為云打造了AI應用框架:首先,將一系列的AI原生技術構筑成后端服務,形成BaaS for AI能力,調(diào)用即可得;其次,將大模型的工程經(jīng)驗做成工程平臺,讓開發(fā)者以5倍速全鏈路開發(fā)行業(yè)大模型及應用;最后,基于Serverless技術,通過面向AI全新升級的FunctionGraph 3.0提供AI的前端開發(fā)框架,利用其“膠水”式拼接能力,將BaaS for AI 后端和大模型工程套件快速拼接、無縫集成。

張宇昕表示,華為云這些系統(tǒng)性創(chuàng)新的云服務能力,可以跨云、網(wǎng)、邊、端等多平臺,以及公有云,邊緣云、混合云等多形態(tài),實現(xiàn)靈活自由的部署和應用。對于建立專屬AI平臺和大模型的需求,企業(yè)可通過華為云Stack平臺,在自有數(shù)據(jù)中心部署AI云服務和大模型的關鍵產(chǎn)品,一站式建設專屬大模型。會上,張宇昕正式發(fā)布華為云Stack 8.3,相關服務將于9月底全面上市商用。

編 輯:T01
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像