首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

我國工業(yè)大模型發(fā)展中的四個反差現(xiàn)象

2024年7月29日 10:09  天翼智庫  作 者:天翼智庫

以大模型為代表的新一代人工智能技術正加速推進新型工業(yè)化的變革進程。2024年1月,國務院常務會議研究部署推動人工智能賦能新型工業(yè)化有關工作,強調(diào)以人工智能和制造業(yè)深度融合為主線,以智能制造為主攻方向,以場景應用為牽引,加快重點行業(yè)智能升級,大力發(fā)展智能產(chǎn)品,高水平賦能工業(yè)制造體系。4月,工信部提出從供給側(cè)、需求側(cè)、基礎側(cè)協(xié)同發(fā)力,加快培育面向工業(yè)領域的大模型。可見,工業(yè)大模型已經(jīng)成為人工智能深度賦能新型工業(yè)化的重點方向;不僅能推動生產(chǎn)制造高效化發(fā)展、大幅縮短生產(chǎn)周期,而且能效降低生產(chǎn)制造的成本消耗,推進工業(yè)綠色化、集約化發(fā)展。

本文總結分析了我國工業(yè)大模型發(fā)展現(xiàn)狀,及現(xiàn)階段工業(yè)大模型發(fā)展過程中存在的幾個明顯反差,并提出發(fā)展趨勢展望。

01 我國工業(yè)大模型發(fā)展現(xiàn)狀

當前,我國大模型已進入發(fā)展加速期,在自然語言處理、機器視覺和多模態(tài)等各技術分支上均與國際技術發(fā)展趨勢同步發(fā)展。在產(chǎn)學研各方共同推動下,我國已建立起涵蓋理論方法和軟硬件技術的體系化研發(fā)能力,涌現(xiàn)出一批具有行業(yè)影響力的大模型應用,形成了緊跟世界前沿的各種大模型技術。目前,我國10億參數(shù)規(guī)模以上的大模型數(shù)量已超100個1。行業(yè)大模型深度賦能電子信息、金融、傳媒、文旅、醫(yī)療、交通、政務等領域。同時,大模型開始向能源、汽車、鋼鐵等工業(yè)領域挺進,在設計、研發(fā)、管理等環(huán)節(jié)嶄露頭角。

現(xiàn)階段,國內(nèi)布局工業(yè)大模型的主體可分為四類:AI廠商、工業(yè)技術服務商、創(chuàng)新成長型企業(yè)、科研機構/科技巨頭。AI廠商主要基于通用基礎大模型賦能工業(yè)領域,主打“大而全”;創(chuàng)新成長型企業(yè)則發(fā)揮自身在細分領域的經(jīng)驗沉淀打造垂直行業(yè)大模型,主打“專而精”;工業(yè)技術服務商則選擇在既有產(chǎn)品中融入AI能力;科研機構/科技巨頭則在國內(nèi)領先的通用大模型基礎上向工業(yè)領域滲透。據(jù)統(tǒng)計,工業(yè)領域已有99個工業(yè)大模型應用案例2。

與國外知名大模型相比,2023年下半年國內(nèi)工業(yè)大模型能力提升明顯。在工業(yè)知識問答、文檔生成等領域,國內(nèi)大模型已取得領先,數(shù)據(jù)分析、代碼理解等領域能力接近;但在工程建模領域,國內(nèi)大模型與國際存在一定差距3。具體參見圖1。

圖1:國內(nèi)外大模型能力對比

資料來源:中國工業(yè)互聯(lián)網(wǎng)研究院《人工智能大模型工業(yè)應用準確性測評》,2024.3

02 我國工業(yè)大模型發(fā)展過程中的四個反差現(xiàn)象

反差1:AI專利具備數(shù)量優(yōu)勢,而制造業(yè)AI普及率低

我國在人工智能專利數(shù)量方面占據(jù)主導地位,但頂級人工智能模型相對較少,且制造企業(yè)AI普及率相對較低。根據(jù)2024斯坦福AI指數(shù)報告,2022年,全球人工智能專利來源中,中國占61.1%,大幅超過美國的20.9%,歐盟和英國僅占2.03%;但 2023 年,全球頂級人工智能模型中,61 個來自美國,歐盟21個,中國15個。另據(jù)凱捷(Capgemini)統(tǒng)計數(shù)據(jù)顯示,日本和美國制造企業(yè)的AI應用率分別達到了30%和28%;相較于這些發(fā)達國家,中國制造企業(yè) AI普及率尚不足11%。

其主要原因在于,目前國內(nèi)外推出的主流大模型仍為公共數(shù)據(jù)集訓練出的基礎大模型,知識面夠廣但不夠?qū)#诠I(yè)各垂直領域的性能表現(xiàn)并不突出。根據(jù)中國工業(yè)互聯(lián)網(wǎng)研究院2024年3月發(fā)布的《人工智能大模型工業(yè)應用準確性測評》報告,國內(nèi)外主流大模型的工業(yè)應用準確性平均得分低于60分,處于明顯領先位置的GPT-4、“文心一言”等大模型總體評分也僅在70分上下,可見基礎大模型在賦能新型工業(yè)化方面還有巨大的發(fā)展?jié)摿洼^大的提升空間。

反差2:通用大模型數(shù)量多,而工業(yè)垂直領域落地少

與通用大模型相比,垂直行業(yè)大模型能夠更直接地深入特定行業(yè)與業(yè)務場景,更精準地滿足行業(yè)特定的需求,可以彌補通用大模型無法最優(yōu)化適配到垂直行業(yè)中的不足。而對于垂直行業(yè)而言,大模型是一種全新的生產(chǎn)力,賦能行業(yè)全流程的同時,可以改變行業(yè)的業(yè)務模式及商業(yè)模式,驅(qū)動行業(yè)實現(xiàn)數(shù)據(jù)化轉(zhuǎn)型。因而,垂直行業(yè)應用將成為大模型產(chǎn)業(yè)落地的關鍵賽道。據(jù)不完全統(tǒng)計,截至2023年7月底,國內(nèi)行業(yè)大模型已完成招標項目超過60個,探索賦能不同行業(yè)場景的落地方式與應用價值,已成為大模型商業(yè)化落地的重要方向。

但從大模型落地行業(yè)領域來看,面向工業(yè)垂直領域的專用模型較少,大模型在工業(yè)垂直場景的應用尚不成熟。截至2023年7月,國內(nèi)130家研發(fā)大模型的公司中,通用大模型為78家,占比60%。另外,行業(yè)大模型在金融、傳媒、文旅、政務、交通等領域的落地應用速度較快,其中約15%的大模型都是金融垂直大模型。

這主要是因為,AI大模型應用于垂直行業(yè)存在以下問題,限制了實際應用效果和行業(yè)場景的拓展:一是缺乏行業(yè)專有知識。不同行業(yè)都有大量區(qū)別于其他行業(yè)的知識、數(shù)據(jù)與流程,大模型需要掌握這些know-how語料才能支撐行業(yè)專屬應用。而通用AI大模型為廣泛應用場景提供了解決方案,但其缺乏特定行業(yè)的專有知識。二是難以精確控制輸出內(nèi)容。通用AI大模型基于通用數(shù)據(jù)生成的內(nèi)容往往過于普遍化,無法滿足垂直行業(yè)的具體需求。在某些情況下,輸出內(nèi)容可能會偏離問題的實質(zhì),給用戶帶來困惑。三是模型泛化能力不足。人工智能大模型在訓練數(shù)據(jù)上表現(xiàn)出色,但在未見過的數(shù)據(jù)上可能泛化能力不足,過度擬合是常見問題,這對大模型在不同行業(yè)落地應用帶來一定門檻。

反差3:工業(yè)大模型覆蓋環(huán)節(jié)多,而核心生產(chǎn)應用少

全球范圍來看可用于工業(yè)領域的大模型超過30個4,形成語言大模型、專用大模型、多模態(tài)大模型和視覺大模型四類核心模型,通過三種方式賦能工業(yè)企業(yè):基于通用底座直接賦能行業(yè)、基于通用底座進行場景化適配調(diào)優(yōu)或形成外掛插件工具、面向工業(yè)或具體任務針對性開發(fā)。

工業(yè)大模型率先落地的場景基本集中在企業(yè)的研發(fā)/設計、設備、管理等環(huán)節(jié),以此提升人機交互性能及業(yè)務系統(tǒng)之間的互通效率,但暫未觸及工業(yè)領域核心“生產(chǎn)”環(huán)節(jié)。如大語言模型主要應用于工業(yè)問答交互、內(nèi)容生成,以提升任務處理效率為主;專業(yè)任務大模型圍繞研發(fā)形成輔助設計、藥物研發(fā)兩個重點方向,進一步增強研發(fā)模式的創(chuàng)新能力;多模態(tài)大模型與視覺大模型則在裝備智能化和視覺識別領域應用進行初步嘗試。

究其原因,工業(yè)大模型在核心生產(chǎn)環(huán)節(jié)的應用受到三個方面的因素制約:一是工業(yè)領域本身門類眾多,各細分行業(yè)高度碎片化和差異化,大模型難以規(guī)模復制和推廣,客觀上提高了其成本和落地門檻。二是工業(yè)生產(chǎn)環(huán)境經(jīng)常涉及復雜的工藝流程、高精度的操作控制以及嚴苛的安全標準。任何模型預測或決策的失誤都可能導致生產(chǎn)事故、質(zhì)量問題或經(jīng)濟損失,因而對可靠性有更嚴格的要求。三是工業(yè)生產(chǎn)對實時性的要求非常高,很多場景需要模型能夠在毫秒級甚至微秒級的時間內(nèi)做出響應;而且,由于計算資源的限制,模型的大小和計算復雜度也需要得到合理控制。這就需要在保證模型性能的同時,盡可能地降低計算復雜度,以實現(xiàn)高效的實時推理。

因而從工業(yè)企業(yè)的角度,會選擇從外圍環(huán)節(jié)引入大模型,而對核心生產(chǎn)環(huán)節(jié)的應用則相對慎重。以化工行業(yè)為例,據(jù)百度智能云相關資料,大模型主要應用于企業(yè)管理、產(chǎn)品質(zhì)檢領域。企業(yè)管理領域利用大模型把行業(yè)里安全生產(chǎn)、管理等各類標準,通過大模型知識固化,形成共性的服務平臺;產(chǎn)品質(zhì)檢領域則主要是在生產(chǎn)過程中需要多輪質(zhì)檢來保障產(chǎn)品質(zhì)量,以此降低成本,提升生產(chǎn)效率。

反差4:對工業(yè)數(shù)據(jù)質(zhì)量要求高,而現(xiàn)有數(shù)據(jù)不完整、不連通

海量、多源、動態(tài)更新的數(shù)據(jù)是訓練模型和進行數(shù)據(jù)挖掘的必要條件,尤其人工智能大模型的訓練需要海量工業(yè)數(shù)據(jù)/語料庫,而且對數(shù)據(jù)規(guī)模、質(zhì)量等的要求很高,因為錯誤或不一致的數(shù)據(jù)可能導致模型訓練不穩(wěn)定或性能下降。如預訓練階段,語言大模型需要40TB的中文文本語料;視覺大模型需要100W+工業(yè)圖像;多模態(tài)大模型的效果則與數(shù)據(jù)量強相關,通常需要億級以上規(guī)模的數(shù)據(jù)。不僅如此,大模型訓練對數(shù)據(jù)的配比要求也較高,工業(yè)數(shù)據(jù)在所有數(shù)據(jù)的占比需要達到約10-15%。

我國在工業(yè)大模型的應用推廣中,面臨三個突出問題:一是工業(yè)企業(yè)數(shù)字化程度參差不齊,各場景、環(huán)節(jié)數(shù)據(jù)結構不統(tǒng)一,導致工業(yè)數(shù)據(jù)質(zhì)量參差不齊,缺乏高質(zhì)量的工業(yè)語料數(shù)據(jù)為大模型的微調(diào)訓練提供支撐。二是工業(yè)生產(chǎn)過程中的各個環(huán)節(jié)相互交織,數(shù)據(jù)之間的關聯(lián)性和復雜性也較高。數(shù)據(jù)的來源、采集方式、時間戳等都會影響數(shù)據(jù)的準確性和完整性。這種數(shù)據(jù)結構的多樣與質(zhì)量的參差不齊給工業(yè)大模型的訓練和應用帶來了挑戰(zhàn)。三是工業(yè)企業(yè)間數(shù)據(jù)壁壘嚴重,限制了數(shù)據(jù)的共享和流通。尤其在核心制造環(huán)節(jié),工業(yè)數(shù)據(jù)通常包含企業(yè)的核心機密和商業(yè)秘密,如工藝參數(shù)、配方、客戶信息等,因而對數(shù)據(jù)隱私與數(shù)據(jù)安全異常敏感。此外,數(shù)據(jù)共建共享、數(shù)據(jù)產(chǎn)權界定等機制不完善,導致數(shù)據(jù)規(guī)模和質(zhì)量無法有效支撐模型訓練,一定程度上限制了工業(yè)大模型的應用進程。

03 工業(yè)大模型發(fā)展展望

大模型向B端尤其是工業(yè)領域應用已成為行業(yè)共識。大模型已呈現(xiàn)出以基礎大模型為技術底座,工業(yè)應用為切入點的發(fā)展趨勢。

大模型成本的降低將加速其在工業(yè)領域的應用。業(yè)界在積極探索各類模型壓縮技術,在保證模型精度的同時,可以有效減少模型的參數(shù)量、計算復雜度和存儲需求,從而降低訓練和推理成本。近期BAT和科大訊飛等大模型廠商紛紛宣布主力模型免費,表明大模型成本已經(jīng)斷崖式下降,這無疑將加快大模型在工業(yè)領域的滲透速度,并最終提高AI在工業(yè)尤其是制造業(yè)的普及率。據(jù)市場研究機構Market Research Future預計,從2022至2032年工業(yè)AI市場規(guī)模將以46%的年均復合增長率高速成長。

定制化大模型將成為更多行業(yè)的選擇。隨著各行各業(yè)對于大模型的深入理解,大模型將更傾向于滿足特定行業(yè)需求,為企業(yè)提供更為精準的解決方案,就像是為每個行業(yè)打造了一套專屬的“大腦”。

從落地應用模式來看,工業(yè)大模型的應用模式將是“基礎大模型+工業(yè)APP”,基于少量工業(yè)基礎大模型快速構建大量工業(yè)APP滿足碎片化應用需求。從而既能依托基礎大模型的結構和知識,又能融合工業(yè)細分行業(yè)的數(shù)據(jù)和專家經(jīng)驗,加快形成垂直化、場景化、專業(yè)化的應用模型,推動各類工業(yè)場景的智能化升級。

工業(yè)企業(yè)對工業(yè)數(shù)據(jù)的管理將會提上一個新臺階。伴隨大模型在各行業(yè)外圍場景落地并逐步向核心生產(chǎn)環(huán)節(jié)滲透,工業(yè)企業(yè)對數(shù)據(jù)的認識和理解會更加深入。包括如何合理收集、清洗和管理數(shù)據(jù),如何確保數(shù)據(jù)的質(zhì)量和全面性,如何保障數(shù)據(jù)的隱私和安全等。而基于各行各業(yè)的探索,相關的機制和制度保障也會愈加完善。

注釋

1.國家數(shù)據(jù)局局長劉烈宏2024年3月25日在中國發(fā)展高層論壇公布的數(shù)據(jù)。

2.騰訊研究院《工業(yè)大模型應用報告》,2024.3。

3.中國工業(yè)互聯(lián)網(wǎng)研究院《人工智能大模型工業(yè)應用準確性測評》,2024.3。

4.工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟&信通院:工業(yè)大模型技術應用與發(fā)展報告1.0,2023.12。

本文作者

柴雪芳

戰(zhàn)略發(fā)展研究所

一級分析師

碩士,高級經(jīng)濟師,就職于中國電信研究院,長期從事信息通信行業(yè)市場研究、客戶研究,近年來專注于產(chǎn)品運營管理、數(shù)字化轉(zhuǎn)型等領域。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
尚冰:中國互聯(lián)網(wǎng)應用蓬勃發(fā)展,多項關鍵指標位居全球第一
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像