7月11日,中國(guó)移動(dòng)完成了業(yè)界首次百公里級(jí)800G以太網(wǎng)智算協(xié)同訓(xùn)練的現(xiàn)網(wǎng)技術(shù)試驗(yàn),標(biāo)志著智算中心互聯(lián)技術(shù)取得重要進(jìn)展,為高效聚合分散算力資源提供了關(guān)鍵技術(shù)支撐。
本次試驗(yàn)主要面向城市群(如京津冀、長(zhǎng)三角城市群)智算中心分布在多地,需要聚合零散算力資源進(jìn)行模型訓(xùn)練的場(chǎng)景。本次試驗(yàn)采用了中國(guó)移動(dòng)提出的全調(diào)度以太網(wǎng)與高速光網(wǎng)絡(luò)融合的技術(shù)體系(GSE-DCI),單臺(tái)設(shè)備將路由功能和長(zhǎng)距光傳輸融合,單光纖可支持高達(dá)32個(gè)800G波長(zhǎng)通道的超大容量傳輸,相比傳統(tǒng)智算中心互聯(lián)技術(shù)實(shí)現(xiàn)了單比特成本降低40%,功耗降低35%,節(jié)點(diǎn)時(shí)延降低20%。在700億級(jí)參數(shù)大模型的并行訓(xùn)練場(chǎng)景下,其訓(xùn)練效率可達(dá)同等GPU規(guī)模單一節(jié)點(diǎn)的98%。該方案可最大限度協(xié)同智算中心內(nèi)外網(wǎng)絡(luò),大幅提升跨智算中心訓(xùn)練算效,有效解決算力碎片化問(wèn)題。
800G以太網(wǎng)是面向未來(lái)智算與互聯(lián)網(wǎng)需求制定的新一代互聯(lián)標(biāo)準(zhǔn)。中國(guó)移動(dòng)引領(lǐng)了全球最大技術(shù)組織IEEE(國(guó)際電氣電子工程師學(xué)會(huì))的中長(zhǎng)距800G以太網(wǎng)標(biāo)準(zhǔn)制定,IEEE是全球電子、計(jì)算機(jī)、通信等領(lǐng)域制定行業(yè)國(guó)際標(biāo)準(zhǔn)的核心機(jī)構(gòu)。
下一步,中國(guó)移動(dòng)將依托算力網(wǎng)絡(luò)試驗(yàn)裝置(CFITI)開(kāi)展更多基礎(chǔ)網(wǎng)絡(luò)前沿技術(shù)驗(yàn)證。