123,123

每經(jīng)記者可楊每經(jīng)編輯董興生

開(kāi)源與閉源之爭(zhēng)延續(xù)到大模型時(shí)代。在尋找“新大陸(16.880, 0.04, 0.24%)”的路上，開(kāi)源與閉源的辯論，就像是一場(chǎng)關(guān)于AI未來(lái)的“航海策略”討論。

開(kāi)源一派認(rèn)為，開(kāi)源能夠促進(jìn)全球科研人員和開(kāi)發(fā)者的協(xié)作，加速AI技術(shù)的迭代與創(chuàng)新。同時(shí)，開(kāi)源讓更多人參與到模型的改進(jìn)和優(yōu)化中，通過(guò)集體智慧解決復(fù)雜的技術(shù)難題。

閉源的倡導(dǎo)者則看重其在商業(yè)化、技術(shù)保護(hù)和產(chǎn)品差異化方面的優(yōu)勢(shì)。閉源模型使得企業(yè)能夠控制產(chǎn)品的開(kāi)發(fā)節(jié)奏和市場(chǎng)策略，保護(hù)其商業(yè)利益。此外，閉源也有助于企業(yè)維護(hù)其技術(shù)優(yōu)勢(shì)，避免競(jìng)爭(zhēng)對(duì)手模仿或超越。

Llama 3的發(fā)布讓開(kāi)源大模型在與閉源的競(jìng)爭(zhēng)中再度“扳回一城”。從測(cè)試結(jié)果來(lái)看，Llama 3的成績(jī)大幅超越了Llama 2，也勝過(guò)了GPT-3.5。

在AI這場(chǎng)沒(méi)有硝煙的“航海競(jìng)賽”中，大模型已然成為眼前的燈塔。未知的是，這座燈塔究竟是向所有航海者開(kāi)放其光芒，還是僅為特定的船只照亮前行的航道。

開(kāi)源在開(kāi)發(fā)者和研究人員中極受歡迎

Meta正沿著開(kāi)源路徑繼續(xù)前進(jìn)。

近日，Meta推出開(kāi)源大模型Llama 3系列，發(fā)布8B和70B兩個(gè)版本。Meta創(chuàng)始人兼首席執(zhí)行官扎克伯格在同一天宣布，基于Llama 3，Meta的AI助手現(xiàn)在已經(jīng)覆蓋Instagram、WhatsApp、Facebook等全系應(yīng)用，并單獨(dú)開(kāi)啟了網(wǎng)站。

與Llama 2相比，Llama 3進(jìn)行了幾項(xiàng)關(guān)鍵的改進(jìn)：使用具128K token（輸入數(shù)據(jù)的最小單元）詞匯表的tokenizer（編譯器），可以更有效地編碼語(yǔ)言，從而顯著提升模型性能；在8B和70B模型中都采用分組查詢注意力（GQA），以提高Llama 3模型的推理效率；在8192個(gè)token的序列上訓(xùn)練模型，使用掩碼來(lái)確保自注意力（Self-Attention）不會(huì)跨越文檔邊界。

據(jù)Meta介紹，Llama 3已經(jīng)在多種行業(yè)基準(zhǔn)測(cè)試上展現(xiàn)了最先進(jìn)的性能，提供了包括改進(jìn)的推理能力在內(nèi)的新功能，是目前市場(chǎng)上最好的開(kāi)源大模型。

此外，Llama 3發(fā)布后，微軟Azure、谷歌云、百度智能云等陸續(xù)宣布其平臺(tái)上線Llama 3。百度方面此前對(duì)《每日經(jīng)濟(jì)新聞》記者表示，百度智能云千帆大模型平臺(tái)在國(guó)內(nèi)首家推出針對(duì)Llama 3全系列版本的訓(xùn)練推理方案，便于開(kāi)發(fā)者進(jìn)行再訓(xùn)練，搭建專(zhuān)屬大模型。

工業(yè)和信息化部工業(yè)文化發(fā)展中心AI應(yīng)用工作組執(zhí)行組長(zhǎng)、行行AI董事長(zhǎng)李明順在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，Meta的Llama 3發(fā)布可能會(huì)帶來(lái)更多AI應(yīng)用落地機(jī)會(huì)和場(chǎng)景，它通過(guò)提供更大詞匯量的Token詞典、更長(zhǎng)的輸入上下文長(zhǎng)度以及優(yōu)化的模型結(jié)構(gòu)，增強(qiáng)了模型的編碼效率和推理效率。“現(xiàn)在，比起Llama 2，Llama 3在代碼能力和邏輯推理能力上有顯著提升，這可能會(huì)促進(jìn)相關(guān)AI應(yīng)用的性能（提升），尤其是在需要復(fù)雜邏輯和代碼理解的場(chǎng)景中去落地�！�

OpenAI在GPT-2之后調(diào)轉(zhuǎn)船頭走向閉源，Meta則成為開(kāi)源界的引領(lǐng)者之一。

從2020年發(fā)布GPT-3，到引發(fā)轟動(dòng)的GPT-3.5，以及2023年3月發(fā)布的GPT-4，都是閉源模型。此前，馬斯克起訴OpenAI時(shí)曾直言：“如果OpenAI改名為ClosedAI，我就撤銷(xiāo)訴訟。”

李明順認(rèn)為，OpenAI的轉(zhuǎn)變可能與其商業(yè)戰(zhàn)略和市場(chǎng)定位有關(guān)。“初期開(kāi)源有助于快速吸引關(guān)注和社區(qū)參與，但隨著公司的發(fā)展，我估計(jì)阿爾特(10.770, -0.15, -1.37%)曼（Sam Altman）的野心和商業(yè)夢(mèng)想越來(lái)越膨脹了，閉源可以更好地讓它融資，包括和微軟合作，保護(hù)領(lǐng)先的技術(shù)優(yōu)勢(shì)。”他表示，從OpenAI的轉(zhuǎn)變中可以看出，開(kāi)源與閉源的選擇并非固定不變，而是需要根據(jù)公司戰(zhàn)略目標(biāo)、市場(chǎng)環(huán)境和產(chǎn)品發(fā)展階段靈活調(diào)整。天下沒(méi)什么事情是絕對(duì)的，很多開(kāi)源公司也是拿著次優(yōu)代碼開(kāi)源，獨(dú)家秘方閉源。

在追逐AGI（通用人工智能）這顆明珠的道路上，迄今為止，Meta依舊持續(xù)沿著開(kāi)源的路徑前行。

2024年初，扎克伯格在Meta第四季度及2023全年財(cái)報(bào)電話會(huì)議上表示：“長(zhǎng)期以來(lái)，我們的策略是構(gòu)建并開(kāi)放源代碼通用基礎(chǔ)設(shè)施，同時(shí)保留我們的具體產(chǎn)品實(shí)現(xiàn)為專(zhuān)有技術(shù)。”

他認(rèn)為，開(kāi)源帶來(lái)了幾個(gè)戰(zhàn)略好處。首先，開(kāi)源軟件通常更加安全可靠，并且因?yàn)樯鐓^(qū)的持續(xù)反饋、審查和開(kāi)發(fā)，更加高效。其次，開(kāi)源軟件經(jīng)常成為行業(yè)標(biāo)準(zhǔn)，“當(dāng)企業(yè)開(kāi)始基于我們的技術(shù)棧建立標(biāo)準(zhǔn)時(shí)，這使得將創(chuàng)新融入我們的產(chǎn)品變得更加容易。這種微妙的優(yōu)勢(shì)，能夠迅速學(xué)習(xí)和改進(jìn)，是巨大的競(jìng)爭(zhēng)優(yōu)勢(shì)，而成為行業(yè)標(biāo)準(zhǔn)正是這一能力的關(guān)鍵”。第三，開(kāi)源在開(kāi)發(fā)者和研究人員中極受歡迎。

開(kāi)源與閉源并不矛盾

開(kāi)源還是閉源，也許是全球人工智能信徒長(zhǎng)久的辯題。在Llama 3誕生前幾天，國(guó)內(nèi)同樣在進(jìn)行一場(chǎng)“辯論”。

4月11日，百度董事長(zhǎng)兼首席執(zhí)行官李彥宏在其內(nèi)部講話中直言，大模型開(kāi)源的意義不大，閉源模型在能力上會(huì)持續(xù)領(lǐng)先，而不是一時(shí)領(lǐng)先，做模型的創(chuàng)業(yè)公司既做模型又做應(yīng)用的“雙輪驅(qū)動(dòng)”不是一個(gè)好的模式。在一周后的Create 2024百度AI開(kāi)發(fā)者大會(huì)上，李彥宏再度提到，大家以前用開(kāi)源覺(jué)得開(kāi)源便宜，其實(shí)在大模型場(chǎng)景下，開(kāi)源是最貴的，所以開(kāi)源模型會(huì)越來(lái)越落后。

360公司創(chuàng)始人周鴻祎則持不同的觀點(diǎn)。他表示：“網(wǎng)上有些名人胡說(shuō)八道，大家也別被他們忽悠，說(shuō)開(kāi)源不如閉源好。一句話，今天沒(méi)有開(kāi)源就沒(méi)有Linux（操作系統(tǒng)內(nèi)核），沒(méi)有Linux就沒(méi)有互聯(lián)網(wǎng)，就連說(shuō)這話的公司自己都借助了開(kāi)源的力量才成長(zhǎng)到今天�！�

這段發(fā)言被解讀為對(duì)李彥宏觀點(diǎn)的回懟，周鴻祎隨后澄清道：“我一直是開(kāi)源的信徒，但是我說(shuō)開(kāi)源好，是（4月）13日在哈佛講的，李廠長(zhǎng)（指李彥宏）說(shuō)閉源好，是（4月）16日在北京講的�！�

生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝站在閉源的一邊。在4月18日舉行的“2024中國(guó)生成式AI大會(huì)”上，唐家渝表示：“在我們看來(lái)，開(kāi)源、閉源都有各自可以做的商業(yè)生態(tài)，但是從模型能力的提升來(lái)說(shuō)，或者持續(xù)走到前列來(lái)說(shuō)，閉源還是會(huì)走到開(kāi)源的前面�！�

昆侖萬(wàn)維(37.520, 0.38, 1.02%)董事長(zhǎng)方漢的觀點(diǎn)是，開(kāi)源模型與閉源模型之間的差距正在不斷縮小。4月16日，方漢在接受《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體采訪時(shí)表示，閉源模型的確是第一，但是開(kāi)源大模型在2023年到今年這一年間，從落后兩年以上，已經(jīng)進(jìn)化到落后4~6個(gè)月以上。

此外，方漢認(rèn)為，在應(yīng)用側(cè)，閉源對(duì)于產(chǎn)品特性和長(zhǎng)尾需求的滿足都落后于開(kāi)源大模型，開(kāi)源大模型是一種生態(tài)構(gòu)建器，更利于滿足用戶的長(zhǎng)尾需求。開(kāi)源大模型和閉源大模型是一個(gè)生態(tài)的組成部分，不是誰(shuí)壓倒誰(shuí)，大家都有自己的生存空間，也都有更好的明天。

不過(guò)，從商業(yè)化上來(lái)講，閉源和開(kāi)源也許并不矛盾。啟明創(chuàng)投合伙人周志峰就認(rèn)為，開(kāi)源閉源在過(guò)去幾個(gè)大浪潮當(dāng)中沒(méi)有很大的沖突，不太理解為什么很多人把閉源、開(kāi)源在AI時(shí)代看成對(duì)立的。

李明順的觀點(diǎn)則是，在當(dāng)前強(qiáng)應(yīng)用導(dǎo)向的背景下，開(kāi)源模式具有顯著優(yōu)勢(shì)，能夠吸引全球范圍內(nèi)最廣泛的人參與，從而使其創(chuàng)新性保持在較高水平。

相較之下，盡管一些閉源大模型在技術(shù)上具有領(lǐng)先地位，但其成本太高。不過(guò)他也強(qiáng)調(diào)，開(kāi)源與閉源在不同公司和應(yīng)用場(chǎng)景中可以相互轉(zhuǎn)換。一些基于開(kāi)源的產(chǎn)品在發(fā)掘到獨(dú)特優(yōu)勢(shì)后，可能會(huì)通過(guò)閉源策略建立競(jìng)爭(zhēng)壁壘。同時(shí)，一些閉源公司也會(huì)不斷將其部分產(chǎn)品開(kāi)源。這兩個(gè)應(yīng)該是共存的，未來(lái)開(kāi)源可能用戶量級(jí)上更大，但是行業(yè)內(nèi)，商業(yè)化做得比較好的公司，往往還是閉源的多一點(diǎn)。

在開(kāi)源與閉源的辯論中，也許答案并非非此即彼。AI的未來(lái)可能既不是完全開(kāi)放的“自由港”，也不是徹底封閉的“孤島”，而是一個(gè)既包含開(kāi)放協(xié)作也包含封閉競(jìng)爭(zhēng)的混合生態(tài)。在這個(gè)生態(tài)系統(tǒng)中，開(kāi)放與封閉不是對(duì)立的兩極，而是一枚硬幣的兩面。

Meta繼續(xù)押寶開(kāi)源大模型 Llama 3拿下“賽點(diǎn)”？

Meta繼續(xù)押寶開(kāi)源大模型 Llama 3拿下“賽點(diǎn)”？