8月19日,在2023中國算力大會(huì)“算力網(wǎng)絡(luò)創(chuàng)新合作大會(huì)”分論壇上,由中國移動(dòng)牽頭,攜手合作伙伴重磅發(fā)布“中移智庫”成果《中國移動(dòng)NICC新型智算中心技術(shù)體系白皮書》。中國移動(dòng)副總工程師、首席科學(xué)家王曉云出席發(fā)布儀式。
新型智算中心是以高性能GPU、AI加速卡等集群算力為核心,集約化建設(shè)的E級(jí)超大規(guī)模新型算力基礎(chǔ)設(shè)施,提供軟硬件AI全棧環(huán)境,支撐大模型的高效訓(xùn)練和推理,賦能全行業(yè)數(shù)智化轉(zhuǎn)型升級(jí)。隨著模型參數(shù)規(guī)模從千億邁向萬億,互聯(lián)、算效、存儲(chǔ)、平臺(tái)、節(jié)能等五大技術(shù)領(lǐng)域?qū)⑦M(jìn)行系統(tǒng)性重構(gòu),推動(dòng)新型智算中心由集群時(shí)期走向超級(jí)池化時(shí)期。
在新互聯(lián)方面,為實(shí)現(xiàn)大規(guī)模卡間高速通信,產(chǎn)業(yè)應(yīng)聯(lián)合打造統(tǒng)一的計(jì)算總線協(xié)議,推動(dòng)國內(nèi)高速互聯(lián)技術(shù)生態(tài)成熟;對(duì)于更大規(guī)模的網(wǎng)絡(luò)互聯(lián),中國移動(dòng)創(chuàng)新性提出全調(diào)度以太網(wǎng)技術(shù)(GSE),革新以太網(wǎng)底層轉(zhuǎn)發(fā)機(jī)制,實(shí)現(xiàn)三大核心機(jī)制轉(zhuǎn)變,打造無阻塞、高帶寬、低時(shí)延、自動(dòng)化的新型智算中心網(wǎng)絡(luò)。
在新存儲(chǔ)方面,為突破GPU顯存容量的限制,簡化AI模型開發(fā),應(yīng)加速內(nèi)存池技術(shù)的成熟,使得CPU、GPU/AI加速卡等異構(gòu)設(shè)備共享統(tǒng)一內(nèi)存,為大模型海量數(shù)據(jù)的高效處理奠定基礎(chǔ)。
在新算效方面,GPU作為主力芯片不斷提升算力能力,并基于存算一體重構(gòu)計(jì)算范式,此外,為滿足海量數(shù)據(jù)處理帶來的極致性能要求,加強(qiáng)CPU,GPU、DPU三大芯片協(xié)同,整體提升智算云服務(wù)能力。
在新平臺(tái)方面,中國移動(dòng)原創(chuàng)提出算力原生技術(shù),打造“芯合”算力原生跨架構(gòu)平臺(tái),目標(biāo)打破“框架+工具鏈+硬件”緊耦合的智算生態(tài),屏蔽底層硬件差異,實(shí)現(xiàn)智算應(yīng)用的跨架構(gòu)遷移部署。
在新節(jié)能方面,針對(duì)智算中心不斷攀升的能耗需求,中國移動(dòng)將堅(jiān)定推進(jìn)液冷技術(shù)成熟,通過制定五大統(tǒng)一標(biāo)準(zhǔn),實(shí)現(xiàn)極致能效、極高密度、極簡運(yùn)維的三“極”目標(biāo)。
中國移動(dòng)將體系化推進(jìn)智算成熟,在制定開放統(tǒng)一的技術(shù)標(biāo)準(zhǔn)的基礎(chǔ)上,打造智算科學(xué)裝置,開展科研類技術(shù)驗(yàn)證;積極發(fā)揮鏈長作用,依托協(xié)同創(chuàng)新基地,聚合產(chǎn)業(yè)生態(tài);結(jié)合算力網(wǎng)絡(luò)試驗(yàn)網(wǎng)CFITI,打造新型智算樣板間,加快我國智算產(chǎn)業(yè)跨越式發(fā)展。中國移動(dòng)愿與產(chǎn)業(yè)合作伙伴一道,共同打造新型算力創(chuàng)新高地。