6月13日,360公司發(fā)布認知型通用大模型“360智腦4.0”,又一家科技公司正式加入AI大模型隊伍。去年年底以來,以ChatGPT為代表的大模型新應用掀起了人工智能發(fā)展的熱潮,文心一言、訊飛星火、京東言犀、通義千問、商湯商量、混元助手等大模型應用先后亮相,有數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個,毫不夸張地說,“百模大戰(zhàn)”已開啟。大模型的意義是什么?我們真的需要那么多大模型嗎?大模型比拼是產(chǎn)業(yè)發(fā)展的風口,還是過度膨脹的泡沫?
大模型是人工智能走向通用的關鍵
隨著數(shù)字技術的發(fā)展,人工智能呈現(xiàn)出深度學習、人機協(xié)同、自主操控等新特征,以ChatGPT為代表的生成式AI應用應運而生,這類生成式AI應用背后的核心技術是大規(guī)模預訓練模型即大模型。
當前,我國人工智能大模型正呈現(xiàn)蓬勃發(fā)展態(tài)勢,《中國人工智能大模型地圖研究報告》顯示,中國已有14個。▍^(qū)、市)開展大模型研發(fā),從全球已發(fā)布的大模型看,中國和美國大幅領先,超過全球總數(shù)的80%!爸袊诖竽P头矫嬉呀⑵鸷w理論方法和軟硬件技術的體系化研發(fā)能力,形成了緊跟世界前沿的大模型技術群,涌現(xiàn)出多個具有行業(yè)影響力的預訓練大模型!敝袊茖W技術信息研究所所長趙志耘在發(fā)布報告時表示。
從大模型目前的應用來看,國內(nèi)通用類大模型在持續(xù)拓展應用領域,打造跨行業(yè)通用化的人工智能能力平臺,應用正從辦公、生活、娛樂向醫(yī)療、工業(yè)、教育等行業(yè)加速滲透,針對生物制藥、遙感、氣象等垂直領域的大模型應用也在不斷深化落地。
“做大模型本就是人工智能的題中應有之義,以前在算力、數(shù)據(jù)條件有限的情況下做不了那么大的模型。小模型也能解決一些問題,但作用范圍有限,大模型就是解決更通用、更復雜的問題,這是一個必然的方向。”智源研究院院長黃鐵軍在接受采訪時表示。
大模型已成為人工智能從專業(yè)智能走向通用智能的關鍵技術。在業(yè)內(nèi)人士看來,大模型憑借優(yōu)越的泛化性、通用性、遷移性,有望加速通用人工智能的到來,建立萬億規(guī)模的下游應用生態(tài),引發(fā)經(jīng)濟社會深刻變革。
大模型良性發(fā)展依然要去虛務實
連日來,各地紛紛加快大模型領域布局,北京市提出系統(tǒng)構建大模型等通用人工智能技術體系,開展大模型創(chuàng)新算法及關鍵技術研究;上海市積極培育了一批大模型研發(fā)團隊,加快研究打造大模型生態(tài)集聚和創(chuàng)新應用高地;深圳市提出研發(fā)基于國際主流大模型的創(chuàng)新產(chǎn)品。
在商業(yè)加速落地和政策引領推動下,大模型將加速推動人工智能產(chǎn)業(yè)發(fā)展。但同時,各企業(yè)紛紛布局大模型,其產(chǎn)品存在水平參差不齊、創(chuàng)新不足等問題。一些測評機構發(fā)布的數(shù)據(jù)顯示,國產(chǎn)大模型在智商、情商、工作提效能力等方面與國外大模型還有較大差距。此外,大模型需要高素質(zhì)AI人才,而目前我國相關人才還不充足。
如今的人工智能“百模大戰(zhàn)”正如當年的互聯(lián)網(wǎng)“百團大戰(zhàn)”,到底哪些應用留得下來,還要經(jīng)過一番市場的洗禮!白罱K大模型應用生態(tài)遵循贏者通吃,對于用戶來說,好用才是大模型應用的關鍵。要鼓勵大模型之間展開深度市場競爭,由市場篩選出勝利者,然后圍繞1~2個勝利者,進行B端賦能,做出有中文互聯(lián)網(wǎng)特色的AI應用!闭憬髮W國際聯(lián)合商學院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林表示,但同時也要避免一哄而上,警惕資本的泡沫和資源的浪費,相關部門也要加強引導和規(guī)劃,整合優(yōu)勢力量加強基礎技術創(chuàng)新,營造有利于產(chǎn)業(yè)發(fā)展的良性生態(tài)。
在盤和林看來,大語言模型是通用AI,需要和很多細分行業(yè)領域結合,開發(fā)細分應用。360公司創(chuàng)始人周鴻祎也表示,中國進入“百模大戰(zhàn)”,除基礎能力外,更重要的是應用場景的比拼。為此,此次360發(fā)布的智腦大模型也率先落地搜索場景,并將接入瀏覽器、搜索、安全衛(wèi)士等應用場景。
大模型訓練所需要的計算和存儲資源大過以往任何的互聯(lián)網(wǎng)應用,大模型應用的成熟離不開持續(xù)的大規(guī)模算力投入以及足夠的研發(fā)資金,需要足夠的實力做支撐。有測算顯示,GPT-3訓練成本單次約500萬美元,訓練數(shù)據(jù)約為《人民日報》45萬年的文字量。對于中國企業(yè)來說,打造聚焦中國市場實際應用場景的產(chǎn)品更具實際意義。
與此同時,大模型應用涉及海量的數(shù)據(jù)和應用場景,會帶來許多不容忽視的安全威脅和始料未及的倫理問題,也給監(jiān)管提出了新的挑戰(zhàn)。周鴻祎表示,大模型帶來很多安全挑戰(zhàn),360創(chuàng)新性建立大模型安全風險評估體系“AISE”,在開發(fā)階段就重視安全問題。對此,監(jiān)管部門也要緊跟新技術發(fā)展趨勢,提前研判可能出現(xiàn)的安全風險。
大模型的發(fā)展說到底還是一場技術的比拼,科技巨頭躍躍欲試過后,比拼噱頭和搶占市場的熱潮終將褪去,真正能經(jīng)受住市場考驗的還是技術含量高、用戶體驗好、落地應用實際高效的產(chǎn)品。對于科技巨頭來說,要回到技術向善的初心上,加大算法投入,加強基礎技術研發(fā),探索出滿足中國市場需求、真正有助于提升生產(chǎn)生活效能的大模型應用。