首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條固定一 >> 正文

突破局限,第四代至強(qiáng)以七大算力神器詮釋工作負(fù)載至上

2023年1月19日 07:16  CCTIME飛象網(wǎng)  作 者:魏德齡

飛象網(wǎng)訊(魏德齡/文)身處數(shù)字化轉(zhuǎn)型浪潮的當(dāng)下,人們對(duì)于運(yùn)算的認(rèn)知也正在發(fā)生變化,除了本地算力,邊緣與云端的算力對(duì)于工作娛樂(lè)生活的影響越來(lái)越大,它決定了生命科學(xué)的進(jìn)展、大數(shù)據(jù)的推理、搜索內(nèi)容的準(zhǔn)確性、視頻流媒體的清晰與否、網(wǎng)絡(luò)能否保持穩(wěn)定流暢等諸多方面。

英特爾至強(qiáng)可擴(kuò)展處理器在其中一直發(fā)揮著至關(guān)重要的作用,無(wú)論是企業(yè)的服務(wù)器與數(shù)據(jù)中心,還是電信運(yùn)營(yíng)商的5G網(wǎng)絡(luò)部署與云化轉(zhuǎn)型,甚至可能是部分城市中的VR電玩店,都能看到至強(qiáng)的身影。自2017年英特爾推出了第一款至強(qiáng)可擴(kuò)展處理器以來(lái),英特爾已經(jīng)向全球客戶交付了超過(guò)8500萬(wàn)顆至強(qiáng)可擴(kuò)展處理器,支持著全世界的數(shù)據(jù)中心。其中,在過(guò)去兩年,第三代英特爾至強(qiáng)可擴(kuò)展處理器已全球累計(jì)出貨1500萬(wàn)顆。

面對(duì)當(dāng)下的種種現(xiàn)實(shí)工作負(fù)載需求,最新發(fā)布的第四代至強(qiáng)不僅僅單純依靠于主頻與核心的提升來(lái)滿足實(shí)際需求,更是通過(guò)七大算力神器,開(kāi)啟一個(gè)CPU芯片設(shè)計(jì)理念和架構(gòu)的新紀(jì)元。

 

七大算力神器突破現(xiàn)有局限

“從行業(yè)應(yīng)用需求到真實(shí)物理世界的局限性,我們?cè)絹?lái)越清晰地感知到,僅僅依靠核心頻率和核心數(shù)量的增強(qiáng),將不能滿足我們?cè)谡鎸?shí)工作負(fù)載場(chǎng)景下對(duì)CPU性能更高的追求。”英特爾市場(chǎng)營(yíng)銷集團(tuán)副總裁莊秉翰在產(chǎn)品發(fā)布過(guò)程中表示。

第四代至強(qiáng)專門(mén)針對(duì)人工智能、5G網(wǎng)絡(luò)、數(shù)據(jù)分析、科學(xué)計(jì)算等現(xiàn)代工作負(fù)載,引入全新的針對(duì)實(shí)際工作負(fù)載優(yōu)化加速的設(shè)計(jì)理念,采用系統(tǒng)級(jí)設(shè)計(jì)方法,在CPU芯片架構(gòu)中內(nèi)置專用的工作負(fù)載加速器,以提升性能和效率。實(shí)際上,這種針對(duì)實(shí)際工作負(fù)載的優(yōu)化,目前已經(jīng)成為了芯片設(shè)計(jì)中的新方向,例如個(gè)人電腦芯片會(huì)針對(duì)視頻轉(zhuǎn)碼工作,進(jìn)行專門(mén)的硬件加速設(shè)計(jì)。CPU的一些工作也逐步被GPU、NPU所分流,進(jìn)而釋放更多算力空間。

第四代至強(qiáng)專門(mén)提供了七大算力神器來(lái)針對(duì)不同的實(shí)際工作需求,包括了:加速深度學(xué)習(xí)實(shí)時(shí)推理和訓(xùn)練性能提升的英特爾AMX加速器;加速處理網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)性能提升的英特爾DLB加速器;加速在存儲(chǔ)、網(wǎng)絡(luò)工作負(fù)載中常見(jiàn)的流數(shù)據(jù)移動(dòng)的英特爾DSA加速器;加速在數(shù)據(jù)分析工作負(fù)載中優(yōu)化內(nèi)存占用和查詢吞吐量的英特爾IAA加速器;加速網(wǎng)絡(luò)吞吐量以及壓縮解壓縮功能的英特爾QAT加速器;加速平臺(tái)安全性能的英特爾安全技術(shù)策略組合;以及提供高帶寬內(nèi)存的英特爾至強(qiáng)CPU Max系列。在基礎(chǔ)參數(shù)上,第四代至強(qiáng)采用Intel 7制程,通過(guò)集成高性能核、更多內(nèi)核數(shù)量、業(yè)內(nèi)高需求的數(shù)據(jù)中心工作負(fù)載的相關(guān)加速器,以及業(yè)界領(lǐng)先的DDR5、CXL1.1、PCIe 5.0。

其中英特爾AMX專屬AI加速器,大幅提升矩陣乘法運(yùn)算,為人工智能加速提供了全新方式,與上一代(FP32)相比,內(nèi)置英特爾高級(jí)矩陣擴(kuò)展(英特爾AMX)(BF16)的PyTorch實(shí)時(shí)AI推理和訓(xùn)練性能提高了10倍。結(jié)合通用CPU計(jì)算單元,第四代英特爾至強(qiáng)可擴(kuò)展處理器可以端到端運(yùn)行任何AI工作負(fù)載。

英特爾動(dòng)態(tài)負(fù)載均衡加速器(英特爾DLB)支持在多個(gè)CPU內(nèi)核及線程間高效分布網(wǎng)絡(luò)工作負(fù)載,實(shí)現(xiàn)分布式處理,并在負(fù)載不平衡時(shí),動(dòng)態(tài)地將數(shù)據(jù)負(fù)載重新分配到各個(gè)CPU內(nèi)核上,實(shí)現(xiàn)動(dòng)態(tài)負(fù)載均衡。此外,英特爾DLB還可以調(diào)整CPU內(nèi)核上同時(shí)處理的網(wǎng)絡(luò)數(shù)據(jù)包的順序,實(shí)現(xiàn)動(dòng)態(tài)網(wǎng)絡(luò)處理重排序,從而達(dá)到更高的整體系統(tǒng)性能。測(cè)試數(shù)據(jù)顯示,與Istio入口網(wǎng)關(guān)軟件在6核12線程上的工作性能相比,第四代英特爾至強(qiáng)處理器在相同吞吐量(RPS)下可降低96%延遲。與前一代處理器相比,在相同功率范圍下,vRAN工作負(fù)載的容量提升高達(dá)2倍。

在數(shù)據(jù)密集型工作負(fù)載應(yīng)用場(chǎng)景下,數(shù)據(jù)移動(dòng)是最常見(jiàn)的工作負(fù)載處理任務(wù)。為了幫助用戶在存儲(chǔ),網(wǎng)絡(luò)和數(shù)據(jù)分析中實(shí)現(xiàn)更快速的數(shù)據(jù)移動(dòng),英特爾在第四代至強(qiáng)處理器中添加了數(shù)據(jù)流加速器(Intel DSA),有助于加快CPU、內(nèi)存、緩存以及存儲(chǔ)和網(wǎng)絡(luò)設(shè)備之間的數(shù)據(jù)移動(dòng)。應(yīng)用將數(shù)據(jù)活動(dòng)從CPU內(nèi)核遷移到DSA專屬加速器,可大幅釋放CPU性能并降低時(shí)延,讓用戶可以更高效地管理CPU內(nèi)核,提高利用率。測(cè)試數(shù)據(jù)顯示,與ISA-L軟件相比,內(nèi)置Intel DSA加速器可使SPDK-NVMe的IOPs提高1.7倍;與上一代相比,大數(shù)據(jù)包順序讀取的IOPS提升60%,并降低37%時(shí)延。而英特爾內(nèi)存分析加速器 (Intel IAA) 針對(duì)數(shù)據(jù)庫(kù)和分析工作負(fù)載,可提高內(nèi)存查詢吞吐量,減少內(nèi)存數(shù)據(jù)庫(kù)和大數(shù)據(jù)分析工作負(fù)載的內(nèi)存占用。Intel IAA是內(nèi)存數(shù)據(jù)庫(kù)、開(kāi)源數(shù)據(jù)庫(kù)和數(shù)據(jù)存儲(chǔ)(如RocksDB和ClickHouse)的理想選擇。與上一代相比,Intel IAA加速器可使RocksDB性能提高3倍。

針對(duì)安全性需求,英特爾SGX、TME、算法硬件加速等,能夠?yàn)榭蛻籼峁┝巳轿坏、契合客戶需求的安全解決方案。英特爾第四代至強(qiáng)幫助實(shí)現(xiàn)零信任安全策略,通過(guò)先進(jìn)的硬件安全技術(shù)為業(yè)務(wù)部署和風(fēng)險(xiǎn)洞察提供全新解決方案,包括提供對(duì)工作負(fù)載和數(shù)據(jù)的隱私和訪問(wèn)控制,為強(qiáng)大而普遍應(yīng)用的加密運(yùn)算提供更高的性能,并為用戶提供預(yù)期行為的硬件保護(hù),以及確保平臺(tái)引導(dǎo)到已知的良好狀態(tài)。

集成HBM的英特爾至強(qiáng)CPU Max系列提供進(jìn)一步的性能增強(qiáng),也是首款基于X86的高帶寬內(nèi)存(HBM)處理器,可支持高達(dá)640億字節(jié)超高帶寬封裝內(nèi)存。4個(gè)物理tile通過(guò)嵌入式多芯片互連橋接(EMIB)單元連接,每個(gè)tile都連接到一個(gè)專用的16gb HBM內(nèi)存堆棧。測(cè)試數(shù)據(jù)顯示,與上一代相比,英特爾至強(qiáng)CPU Max可使科學(xué)計(jì)算工作負(fù)載性能提高3.7倍。

同期,英特爾還發(fā)布了首個(gè)旗艦級(jí)數(shù)據(jù)中心GPU—英特爾數(shù)據(jù)中心GPU Max系列。該產(chǎn)品采用3D封裝的Chiplet技術(shù),在單個(gè)產(chǎn)品上整合了47個(gè)小芯片,集成了超過(guò)了1000億個(gè)晶體管。Max系列GPU提供多達(dá)128個(gè)Xe內(nèi)核和光線追蹤單元,高達(dá)128 GB的高帶寬內(nèi)存。相較上一代產(chǎn)品,Max CPU和Max GPU的組合,可以使生命與材料科學(xué)領(lǐng)域經(jīng)常使用的LAMMPS處理性能提升12.9倍。

 

詮釋工作負(fù)載至上

強(qiáng)大的性能表現(xiàn),更要能夠在實(shí)際工作中實(shí)現(xiàn)效能的提升!拔覀兊目蛻艉推髽I(yè)正在跨工作負(fù)載優(yōu)化他們相關(guān)的KPI,無(wú)論這些KPI是包括更好的性能、更好的效率、更好的延遲、更好的每瓦平臺(tái)性能,還是更好的系統(tǒng)成本(TCO)!鼻f秉翰表示英特爾至強(qiáng)的架構(gòu)、平臺(tái)和加速器創(chuàng)新為在其環(huán)境中運(yùn)行一系列工作負(fù)載的客戶提供了一套性能領(lǐng)先的產(chǎn)品解決方案,無(wú)論是在云端、邊緣還是在本地,通過(guò)更多CPU核心和內(nèi)置加速器組合,提供強(qiáng)大的性能提升。目前,第四代英特爾至強(qiáng)的七大算力神器已經(jīng)主力合作伙伴在不同領(lǐng)域的業(yè)務(wù)中實(shí)現(xiàn)提升。

騰訊自研的一站式機(jī)器學(xué)習(xí)平臺(tái)騰訊太極利用第四代至強(qiáng)的AMX指令集,對(duì)矩陣計(jì)算的加速能力可以實(shí)現(xiàn)BERT模型BF16吞吐量提升到上一代Ice Lake的3.202倍,Int8的吞吐量可以達(dá)到2.05倍的性能指標(biāo)。騰訊視頻云的明眸高清借助第四代至強(qiáng)的AI能力,解決了以往轉(zhuǎn)碼過(guò)程中的瓶頸,通過(guò)和英特爾技術(shù)團(tuán)隊(duì)的聯(lián)合攻關(guān),目前使用至強(qiáng)的指令加速和優(yōu)化之后,視頻增強(qiáng)部分的性能可以提升到以前的1.86倍,在目標(biāo)檢測(cè)推力部分的性能可以提高到以前的1.95倍,極大改善了CPU的推理性價(jià)比,也可以使視頻增強(qiáng)的服務(wù)由獨(dú)立CPU計(jì)算集群就可以完成,大大降低現(xiàn)在的運(yùn)營(yíng)成本。

中國(guó)電信天翼云利用第四代英特爾至強(qiáng)的英特爾DLB硬件加速特性,針對(duì)IPSec的大象流處理做了優(yōu)化。相比之前的純軟件方案,英特爾DLB的加速方案穩(wěn)定可靠,帶來(lái)了更好的線性擴(kuò)展,最高可以達(dá)到4倍以上的吞吐收益,有效解決了在入云環(huán)節(jié)針對(duì)大象流加密處理的業(yè)務(wù)難題。

新一代京東自研服務(wù)器天樞,得益于第四代至強(qiáng)所帶來(lái)的如DDR5、PCIe Gen 5等新平臺(tái)特性,以及與英特爾定制的新一代CPU中進(jìn)行的一些特定性能優(yōu)化和規(guī)格定制,整體性能較上一代提升了70%。其中通過(guò)Intel IAA帶來(lái)的性能優(yōu)化特性,不管是壓縮率還是QPS等指標(biāo),均取得了大幅提升。通過(guò)Intel DSA在虛擬化場(chǎng)景下,整體最大可以帶來(lái)1.7倍以上的性能提升。

字節(jié)跳動(dòng)旗下的火山引擎通過(guò)采用最新第四代英特爾至強(qiáng),在單核能力上、在網(wǎng)絡(luò)轉(zhuǎn)發(fā)能力上,包括在加解密、視頻和AI推理訓(xùn)練能力上,都獲得了大幅提升,根據(jù)測(cè)試顯示可獲得30%以上的整體收益提升。以此為性能基礎(chǔ),包括計(jì)算密集型、內(nèi)存密集型、IO密集型以及HPC的場(chǎng)景實(shí)例都會(huì)全面切換到基于第四代英特爾至強(qiáng)的引擎上來(lái),幫助游戲、汽車(chē)、醫(yī)藥、金融等行業(yè),在內(nèi)外部共同釋放算力,并提升性價(jià)比。

吉利汽車(chē)在超算建設(shè)過(guò)程中,也選擇了第四代英特爾至強(qiáng)可擴(kuò)展處理器,依托其強(qiáng)勁的算力,能夠支持仿真業(yè)務(wù)的高效運(yùn)行,能夠得到更精準(zhǔn)的性能結(jié)果,高效的推進(jìn)研發(fā)測(cè)試,打造更好的汽車(chē)品質(zhì)。吉利汽車(chē)集團(tuán)將借力新一代至強(qiáng)處理器的算力底座,將利用數(shù)據(jù)和數(shù)字技術(shù)的力量,重新定義產(chǎn)品、研發(fā)及制造,助力企業(yè)實(shí)現(xiàn)高質(zhì)增長(zhǎng)目標(biāo)。

展望未來(lái),英特爾提供算力、安全、網(wǎng)絡(luò)、存儲(chǔ)、管理、綠色可持續(xù)發(fā)展等七大支柱性技術(shù)優(yōu)勢(shì)和產(chǎn)品方案,支持從云到邊緣的架構(gòu)升級(jí),助力產(chǎn)業(yè)發(fā)展 “芯加速,行至遠(yuǎn)”。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像