“算力風暴”是橫亙于國內(nèi)大模型發(fā)展路上的第一道坎,數(shù)據(jù)顯示,過去四年,大模型參數(shù)量以年均400%復(fù)合增長,AI算力需求增長超過15萬倍,遠超摩爾定律。
“商湯人工智能計算中心幾乎已經(jīng)滿負荷,正在擴建,上海電信等算力提供方也在建設(shè)國產(chǎn)算力集群,即將對外開放。”業(yè)內(nèi)人士向《IT時報》記者表示。
繼打造人工智能產(chǎn)業(yè)高地后,上海提出要建設(shè)具有國際影響力的大模型生態(tài)高地,從魔都到“!倍,要跨過算力坎。上海正在以全市之力解決算力短缺問題,政府牽頭統(tǒng)籌、調(diào)度、共享算力資源,還對使用算力的大模型企業(yè)大規(guī)模發(fā)送“算力券”。
更多中小企業(yè)表示,數(shù)據(jù)和人才是大模型之爭的核心資源,也是燃眉之急。經(jīng)過近十年科創(chuàng)中心建設(shè)、五年人工智能高地建設(shè),上海已經(jīng)深諳創(chuàng)新之路。不久前發(fā)布的《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施(2023~2025年)》中提出十一條措施,不僅要共建共享語料數(shù)據(jù)資源,還要支持大模型人才落戶。
“算力風暴”倒逼芯片國產(chǎn)化
上海建設(shè)自主可控算力網(wǎng)絡(luò)
“算力很缺,畢竟做大模型預(yù)訓練急需好用的大集群!边_觀數(shù)據(jù)CEO陳運文向《IT時報》記者提到,為了訓練曹植大模型,達觀數(shù)據(jù)斥巨資自建中等規(guī)模的算力集群,但對小企業(yè)來說,如果無法承擔高額算力成本,只能用別人開發(fā)好的大模型。
在上海,目前規(guī)模最大的算力中心應(yīng)數(shù)商湯人工智能計算中心(AIDC),已經(jīng)上架3萬多塊GPU,產(chǎn)生超過6000 PetaFLOPS算力,可支持20多個千億參數(shù)規(guī)模的大模型同時訓練。
然而,即使商湯早在2022年便已建成這座占地87畝的人工智能計算中心,但AIGC帶來的大模型算力風暴席卷速度遠超預(yù)期。如今,這一亞洲最大的智能計算中心正在擴建中。
但,選誰的芯片?
隨著美國針對英偉達高端GPU先后發(fā)布兩次禁令,中國企業(yè)已經(jīng)意識到,只有支持國產(chǎn)GPU,走自主可控之路,才能在大模型之路上走得長遠。
上海市經(jīng)信委基礎(chǔ)設(shè)施處處長潘焱在2023年11月舉行的“算力網(wǎng)絡(luò)與大模型”產(chǎn)業(yè)生態(tài)論壇上表示,除了保障算力供給與調(diào)度外,上海也在構(gòu)建自主可控的算力網(wǎng)絡(luò)建設(shè)。同一論壇上,上海電信副總工程師肖晴提到,上海電信已經(jīng)在臨港建設(shè)了數(shù)千卡國產(chǎn)算力集群,2024年爭取推出萬卡集群。
2023年4月,《IT時報》記者在參觀商湯AIDC時發(fā)現(xiàn),其芯片國產(chǎn)化已在進程中。
同樣作為算力提供方,優(yōu)刻得在內(nèi)蒙古烏蘭察布和上海青浦兩大數(shù)據(jù)中心可提供超3000 PetaFLOPS的AI算力,也在布局國產(chǎn)算力,與沐曦、壁仞等國產(chǎn)芯片廠商聯(lián)合測試。
優(yōu)刻得副總裁劉杰曾在接受《IT時報》記者采訪時表示,雖然在支持大模型訓練上,國產(chǎn)芯片尚有一段距離需追趕,但在大模型推理上,國產(chǎn)芯片較有前景,未來預(yù)估大模型訓練和推理的算力芯片需求是1:3至1:5,甚至更高。
最高補貼10%
上海大規(guī)模發(fā)放“算力券”
上海市區(qū)兩級正在密集出臺算力相關(guān)政策。據(jù)《IT時報》記者了解,上海政府對算力補貼的政策分為兩大類,一是針對算力提供方,對納入統(tǒng)籌管理的算力平臺進行建設(shè)補貼;二是針對算力使用方,對使用算力的單位給予最高10%算力補貼,類似于“算力補貼券”。
2023年11月,上海制定了《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施(2023~2025年)》,被稱為人工智能大模型發(fā)展十一條措施。其中,第三條提到的大模型智能算力加速計劃,將對2024年底前在滬完成智能算力部署并納入統(tǒng)籌、接受調(diào)度的算力建設(shè)主體,經(jīng)評估給予適當額度的部署獎勵;對租用納入本市統(tǒng)籌調(diào)度的算力進行大模型研發(fā)的本市主體,經(jīng)評估按算力集群規(guī)模和成果水平給予最高10%的租用補貼。建設(shè)市域極速智能算力承載網(wǎng),實現(xiàn)市域智能算力中心間100Gb/S以上高速直連和毫秒級時延。
2023年12月,徐匯區(qū)開展人工智能大模型算力補貼項目,申報條件主要是設(shè)立在徐匯區(qū)的算力需求主體,上年度研發(fā)投入占主營業(yè)務(wù)收入5%以上,研發(fā)人員占項目研發(fā)團隊總?cè)藬?shù)50%以上等等。
徐匯區(qū)科委主任張寧在“算力網(wǎng)絡(luò)與大模型”生態(tài)產(chǎn)業(yè)論壇上重點提到幾點,一是在徐匯西岸創(chuàng)建“模速空間”大模型生態(tài)社區(qū);二是與算力供應(yīng)商開展區(qū)域“智能算力加速計劃”,加強市區(qū)算力統(tǒng)籌、探索自建算力服務(wù);三是大模型算力補貼項目,確保大模型企業(yè)算力“夠用、好用”。
上海市經(jīng)信委也在落實“模速空間”的專項政策,協(xié)調(diào)上海電信等算力供應(yīng)方,加速對“模速空間”的算力供給,對接入駐企業(yè)的算力需求,支持企業(yè)的模型開發(fā)與應(yīng)用。
根據(jù)規(guī)劃,到2025年,上海市數(shù)據(jù)中心算力將超過18000 PFLOPS,人工智能公共算力服務(wù)平臺能級躍升,完善算力交易機制,實現(xiàn)跨地域算力智能調(diào)度,通過高效算力調(diào)度,推動算力供需均衡,帶動產(chǎn)業(yè)發(fā)展作用顯著增強。這是《上海市推進算力資源統(tǒng)一調(diào)度指導(dǎo)意見》提出的2025年計劃,可見上海對解決算力困局的清晰目標。
誰掌握優(yōu)質(zhì)數(shù)據(jù)誰突圍
上海共建共享數(shù)據(jù)資源
算力、算法、數(shù)據(jù),被認為是大模型的競爭三要素。近期,研究機構(gòu)Epoch AI指出,對數(shù)據(jù)需求急劇增加,以致可用于訓練的高質(zhì)量文本可能會在2026年耗盡。
“優(yōu)質(zhì)數(shù)據(jù)才是未來大模型的核心競爭力,誰掌握的優(yōu)質(zhì)數(shù)據(jù)多,誰能用得更好,誰就能突圍,但中文教科書只有英文的十分之一。”達觀數(shù)據(jù)CEO陳運文認為,知識密度高的文檔資料才是大模型訓練的優(yōu)質(zhì)數(shù)據(jù),包括教科書、論文、報告等,而微信聊天記錄、淘寶聊天記錄等數(shù)據(jù)的有效性弱。目前,散落在出版社、圖書館等機構(gòu)的優(yōu)質(zhì)數(shù)據(jù),難以界定版權(quán)歸屬于作者、出版社還是其他機構(gòu),這將成為大模型發(fā)展的一大難點。
優(yōu)刻得計算產(chǎn)品線總經(jīng)理鐘春山也認為,中文數(shù)據(jù)的短缺將阻礙大模型的發(fā)展,應(yīng)加大數(shù)據(jù)共享。另外,政府可以多開放應(yīng)用場景給大模型公司,場景用起來有三個好處:首先能形成反饋,對模型進行調(diào)整優(yōu)化;其次能產(chǎn)生更多經(jīng)濟價值,讓大模型真正深入產(chǎn)業(yè);最后能幫助各行各業(yè)提高效率,解決信息不對稱的問題等。
目前,全球70%的數(shù)據(jù)源僅停留在免費公開數(shù)據(jù)集的層面,上海數(shù)交所總經(jīng)理湯奇峰也曾表示,大模型成長所需的高質(zhì)量數(shù)據(jù)庫仍存在供給不足、質(zhì)量不高、多樣性匱乏、標準欠缺等問題。
2023年7月6日世界人工智能大會開幕式上,上海宣布成立大模型語料數(shù)據(jù)聯(lián)盟,由上海人工智能實驗室聯(lián)合中央廣播電視總臺、人民網(wǎng)、國家氣象中心、中國科學技術(shù)信息研究所、上海報業(yè)集團、上海文廣集團等10家單位聯(lián)合發(fā)起。
2023年11月,聯(lián)盟“朋友圈”擴容,12家新成員加入,同時,上海人工智能實驗室聯(lián)合人民網(wǎng)發(fā)起成立中國大模型語料數(shù)據(jù)聯(lián)盟安全治理專委會,為的是推動大模型數(shù)據(jù)安全治理與隱私保護。
早在人工智能發(fā)展初期,上海已經(jīng)在數(shù)據(jù)共享上開了許多先河。此次,上海市人工智能大模型發(fā)展十一條措施也提到,共建共享語料數(shù)據(jù)資源,包括組建大模型語料數(shù)據(jù)聯(lián)盟、建立語料數(shù)據(jù)知識產(chǎn)權(quán)保護框架、依托上海數(shù)據(jù)交易所建立語料數(shù)據(jù)交易板塊等。
AI工程師薪酬躍居首位
上海吸引大模型人才落戶
AI Agent是大語言模型落地的最熱應(yīng)用場景之一,瀾碼科技是研發(fā)AI Agent等大模型應(yīng)用的公司。“我們直接調(diào)用大模型,算力成本由大模型公司承擔,類比云計算公司,我們調(diào)用云服務(wù),按需付費,所以難點是如何挑選不同能力、不同價格的大模型!睘懘a科技CEO周健解釋道,算力對大模型下游企業(yè)來說,還不是最難的挑戰(zhàn)。
對周健來說,最大的挑戰(zhàn)是人,AI產(chǎn)品經(jīng)理、AI需求分析師都十分稀缺。
咨詢公司麥肯錫一份關(guān)于人工智能的報告顯示,預(yù)計2030年中國對AI專業(yè)人員的需求將增至2022年的6倍,人才缺口將達到400萬人。搶人大戰(zhàn)讓人工智能工程師的薪酬水漲船高,智聯(lián)招聘2023年第四季度《中國企業(yè)招聘薪酬報告》顯示,人工智能工程師的平均招聘月薪躍居職業(yè)榜首位,高達22788元。
早在2018年,上海就已開始筑巢引鳳,上海市經(jīng)信委主任張英曾介紹,從2018年至2022年,五年間,上海人工智能產(chǎn)業(yè)規(guī)模從1340億元提升至3056億元,產(chǎn)業(yè)人才從10萬提升到23萬。
如今則進一步落實吸引大模型人才的政策。上海市人工智能大模型發(fā)展十一條措施也提到,優(yōu)先推薦大模型創(chuàng)新重點人才納入國家和本市相關(guān)高層次人才計劃,重點支持大模型相關(guān)緊缺技能人才落戶等。
“上海的數(shù)字化建設(shè)水平、數(shù)字化人才儲備,都是上海發(fā)展生成式人工智能的先天優(yōu)勢!边@是吸引周健留在上海創(chuàng)業(yè)的重要原因。
人工智能走到2.0時代,這句話在上海AI圈,已然具體可感知。金山辦公WPS AI背后的大模型創(chuàng)業(yè)公司MiniMax,其聯(lián)合創(chuàng)始人是前商湯科技副總裁、通用智能技術(shù)負責人閆俊杰。主攻AI Agent的瀾碼科技,其創(chuàng)始人兼CEO周健是依圖10號員工。
在一波接一波的人工智能浪潮中,能留住人才,才是筑造高地的根本。
大模型企業(yè)到底最缺什么?多家上海大模型上下游企業(yè)告訴《IT時報》記者,當前最緊急的是缺算力,中期要解決的是缺人才,未來最重要的難題是缺數(shù)據(jù)。
上海,因為錯過了互聯(lián)網(wǎng)浪潮下誕生的BAT,多少年來被質(zhì)疑不適合創(chuàng)業(yè)。但它用近10年的時間證明,上海適合創(chuàng)新。2015年,上海提出要建設(shè)具有全球影響力的科技創(chuàng)新中心,在創(chuàng)新上尋覓新疆域。
人工智能是上海走向科技創(chuàng)新中心的三駕馬車之一,2022年,上海出臺人工智能領(lǐng)域首部省級地方性法規(guī)《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》,正式提出把上海市建成具有國際影響力的人工智能高地。不僅為我國人工智能治理貢獻了“上海方案”,也為上海接住大模型浪潮鋪了路。
如今,上海市人工智能大模型發(fā)展十一條措施出臺,政府在算力、人才、數(shù)據(jù)等方面全維度著力,可見魔都上海向“模”都的轉(zhuǎn)型,是堅定而具體的。