飛象原創(chuàng)(孫迎新/文)很難想象,科學(xué)家的腦波興奮點來得如此突然與猝不及防。今天(9月24日)凌晨,隨著OpenAI新一代人工智能大模型o1的推出而變得異常活躍的首席執(zhí)行官山姆奧特曼,破天荒發(fā)布長文《智能時代》,并興奮地寫道:深度學(xué)習(xí)生效了!
從對OpenAI新一代人工智能大模型的命名就可以看出山姆奧特曼難掩的興奮。o1這簡單的兩個字符極有內(nèi)涵、寓意深遠。其中的o是orion獵戶座,1代表從頭開始,也意味著后續(xù)將誕生更多序列。至于獵戶座,在科學(xué)家們的眼中是無比神圣的,這源于詹姆斯·韋伯太空望遠鏡在獵戶座星云中發(fā)現(xiàn)了關(guān)鍵的碳分子甲基陽離子(CH3+),這是一種在星際空間中從未見過的重要碳化合物,除此之外還包括讓天文學(xué)家們興奮得手足無措的木星質(zhì)量二元天體、原恒星、褐矮星等。
o1還有另一個外界比較熟悉的名字,就是此前OpenAI一直在高調(diào)宣傳的草莓大模型。OpenAI沒有延續(xù)使用此前的GPT序列,還有另一個重要原因就是其與傳統(tǒng)預(yù)訓(xùn)練模型有新的變革性訓(xùn)練方法和功能。o1具備復(fù)雜推理能力,解決比目前專業(yè)的科學(xué)、代碼和數(shù)學(xué)模型所能解決的更難的問題。但值得注意的是,相比GPT-4o等其他大模型,o1推理時間較長、使用成本更高,在不需要復(fù)雜推理的場景并沒有明顯優(yōu)勢,也意味著o1并非GPT-4o的替代品,兩者將并存,未來不排除實現(xiàn)融合。
這或許也從另一個方面說明o1的問世極其不容易,就連Meta首席AI科學(xué)家楊立昆都在為山姆奧特曼捏著一把汗。楊立昆此前憂心忡忡地表示,盡管OpenAI在開始時成功的可能性被認為很低,但其目標是推進人工智能變革,并且應(yīng)該樂觀地發(fā)展人工智能。
在人工智能的浪潮中,大模型如同一艘巨輪,承載著人類對于智能未來的無限憧憬。隨著技術(shù)的不斷進步,我們正站在一個新的起點上,探索如何實現(xiàn)大模型的能力提升,走出一條AI跨越之路。
智能時代的跨越之路:大模型能力提升
在大模型的訓(xùn)練過程中,傳統(tǒng)的路徑是通過增加模型的參數(shù)量和數(shù)據(jù)量來提升模型的性能。這種方法雖然有效但非常暴力,因為隨著模型規(guī)模的增大,所需的計算資源和數(shù)據(jù)量呈指數(shù)級增長,這不僅對硬件提出極高的要求,也帶來巨大的能源消耗和成本問題。
誕生于中國上海的人工智能領(lǐng)先企業(yè)深蘭科技的創(chuàng)始人陳海波就算過一筆賬,結(jié)論就是大模型的訓(xùn)練相當費錢,這讓公司在大模型的訓(xùn)練與做高性能的自動駕駛系統(tǒng)、手脈識別系統(tǒng)、DMS司機監(jiān)控系統(tǒng)等之間只能二選一。為此,陳海波非常理智地表示,在大數(shù)據(jù)和云計算的推動下,人工智能將迎來前所未有的發(fā)展機遇,成為引領(lǐng)新一輪科技革命的戰(zhàn)略性技術(shù)。
好在隨著OpenAI的o1模型的推出,我們看到另一種新的訓(xùn)練方式——通過增加學(xué)習(xí)時間和推理時間來提升模型的能力。o1模型采用了大規(guī)模自我對弈強化學(xué)習(xí)的方法,讓模型在不斷的自我博弈中學(xué)習(xí)解決問題,這種方法類似于人類的學(xué)習(xí)過程,通過不斷的嘗試和糾錯來掌握新技能。o1在數(shù)學(xué)、編碼和科學(xué)領(lǐng)域的出色表現(xiàn),證明了這種訓(xùn)練方式的有效性。
然而,增加參數(shù)量和數(shù)據(jù)量依然是提升大模型能力的重要途徑。通過構(gòu)建更加龐大的模型和使用更加海量的數(shù)據(jù),可以使得模型在理解和生成文本、圖像、音頻等方面更加精準和多樣化。例如,谷歌的“大腦團隊”通過構(gòu)建更大的模型,使得機器在視覺識別和自然語言處理等領(lǐng)域取得了突破性的進展。此外,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛也認為,AI大模型的進化速度將一日千里,一旦AI收到用戶的海量反饋,“智慧飛輪”會迅速轉(zhuǎn)動。
同時針對讓大多數(shù)人工智能企業(yè)聞風(fēng)喪膽的大模型訓(xùn)練成本問題,騰訊采取的策略是投入大量資源構(gòu)建基礎(chǔ)模型,并將其應(yīng)用到每一個業(yè)務(wù)線中,以推動產(chǎn)業(yè)實用化。
深度學(xué)習(xí):AI向AGI邁進的橋梁
可以毫不夸張地說,深度學(xué)習(xí)是現(xiàn)代人工智能的基石,也是通往AGI(Artificial General Intelligence通用人工智能)的必由之路。它通過模擬人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使得機器能夠從數(shù)據(jù)中自動學(xué)習(xí)和提取特征,完成復(fù)雜的任務(wù)。隨著深度學(xué)習(xí)技術(shù)的不斷進步,大模型的能力才能得以不斷提升。華為與科大訊飛合作打造基于深度學(xué)習(xí)的通用大模型底座,被視為中國在該領(lǐng)域的重要里程碑,也體現(xiàn)了雙方在人工智能和信息技術(shù)基礎(chǔ)設(shè)施上的深厚積累。
深度學(xué)習(xí)為大模型提供了至關(guān)重要的復(fù)雜推理能力。o1模型的推出,就展示出深度學(xué)習(xí)在復(fù)雜推理能力上的巨大潛力。它通過內(nèi)置的思維鏈(CoT)和推理標記,使得模型能夠在解決問題前進行深入的思考,并將推理過程外化,使得模型的決策過程更加透明和可解釋。
深度學(xué)習(xí)的發(fā)展也推動了大模型在跨模態(tài)能力上的突破。例如,通過深度學(xué)習(xí)技術(shù),大模型不僅能夠理解和生成文本,還能夠處理圖像、音頻等多種類型的數(shù)據(jù),實現(xiàn)更加豐富和自然的人機交互。
算力提升:計算卡從萬卡向十萬卡演進
算力是推動大模型發(fā)展的核心動力。隨著模型規(guī)模的增大和訓(xùn)練復(fù)雜度的提高,對算力的需求也在不斷增長。對此,華為是深有體會,華為輪值董事長孟晚舟指出,算力的稀缺和昂貴是制約AI發(fā)展的核心因素,因此華為將改變傳統(tǒng)的服務(wù)器堆疊模式,以系統(tǒng)架構(gòu)創(chuàng)新的思路打造AI集群,實現(xiàn)算力提升。
作為智算集群的最小計算單元,人工智能計算卡從萬卡到十萬卡的演進,不僅僅是數(shù)量上的增加,更是對計算資源的優(yōu)化和利用。通過構(gòu)建更加高效的智算集群,可以更好地支持大模型的訓(xùn)練和推理,提升模型的性能和應(yīng)用效果。然而這個過程時刻伴隨著人工智能企業(yè)在成本與性能之間的痛苦摩擦,百度副總裁石清華就表示,人工智能已經(jīng)從“散裝”的上半場發(fā)展到了“通用”的下半場。只有讓用戶達到降本、提效、增收的目的,才是一個合格的人工智能。
AI基礎(chǔ)設(shè)施的建設(shè)因此也成為了重中之重。為了支持AI的發(fā)展,需要建設(shè)足夠的基礎(chǔ)設(shè)施,包括數(shù)據(jù)中心、能源容量和傳輸、半導(dǎo)體制造等。這些基礎(chǔ)設(shè)施的建設(shè),將為大模型的訓(xùn)練和應(yīng)用提供強大的支持,這一點作為“老牌”人工智能企業(yè)的微軟看得尤其透徹。微軟全球資深副總裁侯陽表示,微軟堅信任何一家公司都需要具備駕馭算力底座支撐中國人工智能事業(yè)的發(fā)展。有了強大的AI基礎(chǔ)設(shè)施,人工智能才能展現(xiàn)出巨大潛力,未來每個應(yīng)用程序都將由人工智能驅(qū)動。
總而言之,在智能時代的跨越之路上,大模型的能力提升是我們探索的核心。通過革新訓(xùn)練方式、深化機器學(xué)習(xí)技術(shù)、提升算力,我們正逐步推動人工智能向通用人工智能邁進。這不僅是技術(shù)的突破,更是對人類智慧的一次偉大致敬。未來,隨著技術(shù)的不斷進步,我們有理由相信,人工智能將帶來更多的驚喜和可能,開啟一個全新的智能時代。
協(xié)同進化:大模型與小模型共繪AI融合之路
如果說人工智能是浩瀚的星河,那大模型與小模型就猶如兩顆璀璨的星辰,各自散發(fā)著獨特的光芒。人工智能大模型通常指擁有超大規(guī)模參數(shù)(如數(shù)十億甚至數(shù)千億個參數(shù))和復(fù)雜計算結(jié)構(gòu)的機器學(xué)習(xí)模型。這些模型通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù),能夠處理大規(guī)模的數(shù)據(jù)集并完成各種復(fù)雜的任務(wù),例如自然語言處理、圖像識別等。相對而言,人工智能小模型是指參數(shù)數(shù)量較少、結(jié)構(gòu)相對簡單的機器學(xué)習(xí)模型。它們在設(shè)計和訓(xùn)練上更注重效率和實用性,適用于資源有限的環(huán)境中。
大模型與小模型:雙星閃耀
在人工智能的世界里,大模型與小模型是兩種截然不同的存在。大模型通常指的是參數(shù)眾多、結(jié)構(gòu)復(fù)雜、訓(xùn)練數(shù)據(jù)龐大的模型,它們在處理復(fù)雜任務(wù)、進行深度學(xué)習(xí)和理解時表現(xiàn)出色。而小模型則以其輕量級、快速響應(yīng)、易于部署的特點,在多種應(yīng)用場景中展現(xiàn)出獨特的優(yōu)勢。例如,OpenAI的GPT系列模型,通過海量參數(shù)和數(shù)據(jù)的訓(xùn)練,展現(xiàn)出了令人驚嘆的語言理解和生成能力。
中國在人工智能大模型領(lǐng)域奮起直追,雖然起步稍晚但進展神速。例如,百川智能發(fā)布了超千億大模型Baichuan 3,盡管整體性能還需要追趕GPT-4,但假以時日性能差異將逐步縮小。百川智能的創(chuàng)始人兼CEO王小川表示,百川智能的目標是成為中國最好的大模型,并且正在按部就班地訓(xùn)練其大模型。此外,智譜AI總裁王紹蘭也表示,智譜AI在技術(shù)追趕速度上與百川智能不相上下,智譜AI的GLM-130B在問世后就戰(zhàn)勝了GPT-3。
小模型的應(yīng)用:助力具身智能的發(fā)展
而人工智能小模型則以其小巧的體積和高效的運算速度,在資源受限的設(shè)備上展現(xiàn)出了巨大的應(yīng)用潛力。它們易于部署,對硬件的要求較低,因此在移動設(shè)備、嵌入式系統(tǒng)等領(lǐng)域有著廣泛的應(yīng)用。例如,智能手機上的語音助手、智能家居控制等,都是小模型的典型應(yīng)用。
此外,小模型在具身智能的發(fā)展中扮演著重要的角色。具身智能是指通過物理實體與環(huán)境交互,實現(xiàn)智能增長的智能系統(tǒng)。在這一領(lǐng)域,小模型以其輕量級和高效的特點,為智能一體機與人形機器人的發(fā)展提供了強大的動力。商湯科技聯(lián)合創(chuàng)始人徐立就對具身智能表現(xiàn)出濃厚興趣,希望能夠跳出思維定勢,不斷創(chuàng)新嘗試,激發(fā)更多可能性。
就連IT業(yè)元老聯(lián)想也在人工智能領(lǐng)域分到了一杯羹。聯(lián)想推出的智能體一體機,通過高度集成的軟硬件設(shè)計,提供了大模型智能應(yīng)用落地的最小單元。這種一體機通過最優(yōu)算力適配,幫助用戶快速落地智能體,打通了從概念到應(yīng)用的關(guān)鍵環(huán)節(jié)。小模型在這里的應(yīng)用,使得智能體能夠快速響應(yīng),為用戶提供實時的智能服務(wù)。
人形機器人是具身智能領(lǐng)域最吸引眼球的存在。在人形機器人上,小模型的應(yīng)用同樣至關(guān)重要。例如,達闥科技的人形機器人Cloud Ginger,通過小模型的應(yīng)用,實現(xiàn)了迎賓接待、智能問詢、航班查詢等功能,為機場、酒店等場景提供了智能化的服務(wù)。小模型的輕量級和高效運算,使得人形機器人能夠更加靈活地與環(huán)境交互,提供更加自然和人性化的服務(wù),畢竟人們在這種場景下,需要的是靈活快速的服務(wù)響應(yīng),獲得的是來自于科技的情緒滿足價值,而并非是半天不響應(yīng),深思熟慮后的專家服務(wù)體驗。
大模型獨特的應(yīng)用領(lǐng)域依然不可取代
與小模型相比,大模型在一些特定的應(yīng)用領(lǐng)域具有獨特的優(yōu)勢。這些領(lǐng)域通常需要模型具備強大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力。科大訊飛副總裁劉聰就指出,大模型在數(shù)據(jù)處理能力和智能表現(xiàn)上明顯優(yōu)于傳統(tǒng)的小模型,應(yīng)該重新審視人工智能的潛力與應(yīng)用前景。
在科學(xué)研究領(lǐng)域,大模型能夠處理和分析海量的科學(xué)數(shù)據(jù),為科學(xué)家提供強大的輔助。例如,在生物信息學(xué)領(lǐng)域,大模型能夠幫助科學(xué)家分析復(fù)雜的生物數(shù)據(jù),加速藥物研發(fā)和基因研究的進程。
在氣候模擬領(lǐng)域,大模型能夠處理和模擬全球氣候系統(tǒng)的復(fù)雜變化,為氣候變化研究提供重要的支持。通過分析歷史氣候數(shù)據(jù)和模擬未來氣候變化,大模型能夠幫助科學(xué)家更好地理解氣候變化的規(guī)律,為應(yīng)對氣候變化提供科學(xué)依據(jù)。
在人工智能的發(fā)展道路上,大模型與小模型正如雙星系統(tǒng),相互補充、相互促進。小模型在具身智能領(lǐng)域的應(yīng)用,為智能一體機與人形機器人的發(fā)展提供了強大的動力;而大模型則在科學(xué)研究、氣候模擬等復(fù)雜領(lǐng)域展現(xiàn)出了獨特的優(yōu)勢。未來,隨著技術(shù)的不斷進步,我們有理由相信,大模型與小模型將共同推動人工智能的發(fā)展,開啟一個全新的智能時代。
AI創(chuàng)新的千面英雄:大模型賦能千行百業(yè)的應(yīng)用之路
大模型正以其獨特的魅力和力量,逐漸滲透到千行百業(yè)的每一個角落。它們不僅替代了眾多腦力勞動,釋放了人類的創(chuàng)新潛力,還催生了巨大的經(jīng)濟價值,推動了各行各業(yè)的智能化轉(zhuǎn)型。大模型作為人工智能領(lǐng)域的集大成者,通過其強大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,在多個領(lǐng)域展現(xiàn)出了無可比擬的優(yōu)勢。它們正在替代一部分腦力勞動,幫助人類釋放更大的創(chuàng)新空間。
在科學(xué)研究領(lǐng)域,大模型能夠處理和分析海量的數(shù)據(jù),為科學(xué)家提供強大的輔助。例如,DeepMind的AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測上的突破,極大地加速了生物醫(yī)學(xué)研究的進程。在藝術(shù)創(chuàng)作領(lǐng)域,大模型能夠生成獨特的藝術(shù)作品,激發(fā)藝術(shù)家的創(chuàng)作靈感。
在法律、金融、醫(yī)療等行業(yè),大模型通過自然語言處理和知識圖譜技術(shù),能夠自動化處理大量的文檔和數(shù)據(jù),提高工作效率,減少人為錯誤。例如,法律行業(yè)中的合同分析、醫(yī)療行業(yè)中的病例診斷等,大模型的應(yīng)用正在改變傳統(tǒng)的工作方式。
大模型虹吸效應(yīng):創(chuàng)造更大的經(jīng)濟價值
隨著大模型技術(shù)的不斷發(fā)展和應(yīng)用,一些頭部公司憑借其技術(shù)優(yōu)勢和資源積累,正在形成顯著的虹吸效應(yīng),創(chuàng)造出更大的經(jīng)濟價值。
技術(shù)優(yōu)勢的積累形成了虹吸效應(yīng)中的勢能。頭部公司如谷歌、Facebook、百度等,通過持續(xù)的技術(shù)研發(fā)和創(chuàng)新,構(gòu)建了強大的技術(shù)壁壘。它們開發(fā)的大模型在性能和應(yīng)用上遙遙領(lǐng)先,吸引了大量的用戶和合作伙伴,形成了正向的反饋循環(huán)。
而商業(yè)模式的創(chuàng)新則進一步助推了虹吸效應(yīng)的形成。頭部公司通過大模型技術(shù),探索了新的商業(yè)模式和收入來源。例如,通過提供云服務(wù)、API接口、智能硬件等,將大模型技術(shù)轉(zhuǎn)化為實際的商業(yè)價值。此外,大模型技術(shù)也為個性化服務(wù)和產(chǎn)品提供了可能,滿足了市場的細分需求。
在這場由大模型驅(qū)動的智能轉(zhuǎn)型盛宴中,各大科技企業(yè)紛紛顯露身手。騰訊副總裁、AI lab院長姚星表示,盡管目前人工智能仍處于非常早期的階段,但騰訊的戰(zhàn)略包括打造通用AI、成立機器人實驗室以及聚焦“AI+醫(yī)療”戰(zhàn)略。騰訊的策略是投入大量資源構(gòu)建基礎(chǔ)模型,并將其應(yīng)用到每一個業(yè)務(wù)線中,以推動產(chǎn)業(yè)實用化。
華為常務(wù)董事、華為云CEO張平安在世界人工智能大會(WAIC 2024)上表示,中國應(yīng)追求在行業(yè)領(lǐng)域構(gòu)筑大模型的領(lǐng)先地位。
阿里巴巴集團主席蔡崇信則強調(diào)了“開放”理念,助力各行業(yè)數(shù)字化轉(zhuǎn)型,并發(fā)布了AI開源社區(qū)“魔搭”,匯聚了大量開發(fā)者和優(yōu)質(zhì)模型。
商湯科技聯(lián)合創(chuàng)始人楊帆認為,新一輪AI浪潮帶來了AI產(chǎn)業(yè)發(fā)展的新機遇,大模型并非單純依賴于“暴力美學(xué)”,而是背后涉及大量的軟件工程系統(tǒng)問題。未來要推動AI數(shù)據(jù)的基礎(chǔ)設(shè)施化,使中國AI產(chǎn)業(yè)持續(xù)發(fā)揮優(yōu)勢,通過構(gòu)建強大的人工智能基礎(chǔ)設(shè)施,為AI所需要的算力、算法和數(shù)據(jù)提供更加規(guī);、高效率、低成本的基礎(chǔ)支撐。
中國移動九天工業(yè)大模型:賦能千行百業(yè)
9月23日,中國移動以“AI領(lǐng)航,智造未來”為主題,發(fā)布了“中國移動九天·工業(yè)大模型”應(yīng)用。中國移動九天工業(yè)大模型的發(fā)布,標志著大模型技術(shù)在工業(yè)領(lǐng)域的深度融合和應(yīng)用,為各行各業(yè)的數(shù)字化轉(zhuǎn)型提供了強有力的支持。
在行業(yè)應(yīng)用的深度融合方面,九天工業(yè)大模型面向石化、電力、礦山、冶金、裝備制造等重點行業(yè),提供了AI+工業(yè)安監(jiān)、質(zhì)檢、產(chǎn)業(yè)大腦、輕工廠、設(shè)備管理等一系列應(yīng)用。這些應(yīng)用通過大數(shù)據(jù)分析和智能算法,優(yōu)化了生產(chǎn)流程,提高了生產(chǎn)效率和安全性。
作為數(shù)字化轉(zhuǎn)型的加速器,九天工業(yè)大模型的發(fā)布,為工業(yè)企業(yè)的數(shù)字化轉(zhuǎn)型提供了新的路徑和工具。通過大模型技術(shù),企業(yè)能夠更好地理解市場和客戶需求,優(yōu)化產(chǎn)品設(shè)計和制造過程,實現(xiàn)個性化和柔性生產(chǎn)。
發(fā)布會上,安徽移動副總經(jīng)理邢宏濤表示,在信息化領(lǐng)域,安徽移動持續(xù)推動新型信息服務(wù)體系建設(shè),通過深度賦能千行百業(yè),目前已落地超200個5G工業(yè)互聯(lián)網(wǎng)重點項目,覆蓋智慧工廠、智慧礦山、智慧冶金、智慧電力等眾多行業(yè),形成了工業(yè)視覺、AI視頻監(jiān)控、數(shù)據(jù)采集、標識體系、智能巡檢等一批典型“5G+”“AI+”行業(yè)應(yīng)用。
智能時代的暢想:我們看到的AI未來
大模型作為人工智能領(lǐng)域的千面英雄,正在以其獨特的方式,改變著世界的面貌。它們在千行百業(yè)的廣泛應(yīng)用,不僅替代了眾多腦力勞動,釋放了人類的創(chuàng)新潛力,還催生了巨大的經(jīng)濟價值,推動了各行各業(yè)的智能化轉(zhuǎn)型。隨著技術(shù)的不斷進步和應(yīng)用的不斷深入,我們有理由相信,大模型將在未來發(fā)揮更加重要的作用,成為推動社會進步的重要力量。
山姆奧特曼在其《智能時代》一文中描述了他想象的未來:“我相信未來將會如此光明,以至于沒有人能夠通過文字真正描述它的美好。智能時代的標志性特征將是巨大的繁榮,雖然進展會是漸進的,但一些驚人的成就——如解決氣候問題、建立太空殖民地以及完成物理學(xué)的發(fā)現(xiàn)——最終將變得司空見慣。憑借近乎無限的智能和豐富的能源,產(chǎn)生偉大想法以及將這些想法付諸實現(xiàn)的能力,我們能夠做的事情將遠超現(xiàn)在的想象!
是的。這也是我們的智能時代,我們共同的AI未來。
關(guān)于人工智能更多前沿新鮮資訊,敬請關(guān)注飛象網(wǎng)在2024PT展上的報道。