123,123,123

5月17日，騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)在北京召開，公布騰訊大模型應(yīng)用產(chǎn)品的系列進(jìn)展。

這些進(jìn)展包括：發(fā)布具備處理超過38萬字符超長文本能力的長文模型，上線一站式AI智能體創(chuàng)作與分發(fā)平臺(tái)“騰訊元器”，發(fā)布三大引擎工具，預(yù)告C端助手App騰訊元寶發(fā)布時(shí)間。

《每日經(jīng)濟(jì)新聞》記者注意到，長文模型、個(gè)人助手、智能體平臺(tái)都是近期大模型廠商們的競爭焦點(diǎn)。一旦有應(yīng)用在市場激起“水花”，就會(huì)漾起同行的波瀾，推動(dòng)其他廠商跟進(jìn)研究。這樣的氛圍，讓大模型應(yīng)用遭遇了彼此“狹路相逢”的場景。

騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示：“今天，大家對于大模型的訴求更加務(wù)實(shí)，不僅關(guān)注模型技術(shù)的領(lǐng)先性，也要看怎么融合到業(yè)務(wù)場景，怎么降本增效解決實(shí)際問題。”

大廠激戰(zhàn)大模型

這個(gè)5月，全球大模型圈好不熱鬧。OpenAI推出了全能模型GPT-4o，展示了毫秒級(jí)反應(yīng)和多模態(tài)交互的新能力。隨后，谷歌在其I/O開發(fā)者大會(huì)上展示AI助手Astra和旗艦大模型Gemini。

在國內(nèi)，阿里云于5月9日正式發(fā)布通義千問2.5。5月15日，字節(jié)跳動(dòng)發(fā)布豆包大模型并挑起“價(jià)格戰(zhàn)”。更早的4月15日，百度推出AgentBuilder、 AppBuilder、ModelBuilder三大開發(fā)工具。

給激戰(zhàn)的5月再添一把“火”的是騰訊。在5月17日舉辦的騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)上，騰訊公布其大模型的多項(xiàng)新進(jìn)展：基于混元大模型的一站式AI智能體創(chuàng)作與分發(fā)平臺(tái)“騰訊元器”首次亮相，企業(yè)和開發(fā)者可以基于騰訊元器直接創(chuàng)建智能體，使用騰訊官方的插件和知識(shí)庫，還能將這些智能體一鍵分發(fā)到QQ、微信客服、騰訊云等渠道上。騰訊還預(yù)告，基于混元大模型打造的C端助手App“騰訊元寶”將于5月30日發(fā)布。

同時(shí)，多個(gè)版本的模型，如hunyuan-pro、hunyuan-standard、hunyuan-lite，通過騰訊云對外開放，可滿足企業(yè)客戶、開發(fā)者在不同場景下的模型需求，落地最優(yōu)性價(jià)比模型方案。其中hunyuan-standard模型具備256k的超長上下文理解能力，單次處理字符數(shù)超過38萬個(gè)。

騰訊云也專門推出了三款PaaS（平臺(tái)即服務(wù)）產(chǎn)品——大模型知識(shí)引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎，打造大模型原生工具鏈，助力企業(yè)在知識(shí)服務(wù)、圖像和視頻創(chuàng)作上提質(zhì)提效。

大模型應(yīng)用爆發(fā)？

隨著各大廠商加速推出大模型的細(xì)分應(yīng)用，不少機(jī)構(gòu)判斷，今年大模型應(yīng)用將會(huì)爆發(fā)。

海通國際研報(bào)指出，2024年有望成為國產(chǎn)大模型全面商業(yè)落地的元年，先進(jìn)的大模型能力也將逐漸轉(zhuǎn)化為落地實(shí)際場景的產(chǎn)品應(yīng)用，從而帶動(dòng)大模型在金融、教育、法律、醫(yī)療等眾多垂直行業(yè)的持續(xù)落地，AI2B與AI2C的需求天花板也有望全面打開，在這個(gè)過程中，AI的投資也從映射和跟隨，變?yōu)橐I(lǐng)。

談到大模型的落地應(yīng)用，湯道生在會(huì)上表示，隨著產(chǎn)業(yè)信息的載體多元化，使用者對模型的需求不僅僅是處理單純的文字，還需要它處理圖片、視頻等多種信息。大模型的能力競爭，正在從單一的文生文，拓展到文生圖、文生視頻、圖生圖、圖生視頻等多模態(tài)能力。

OpenAI日前發(fā)布的AI助手GPT-4o邁向了更自然的人機(jī)交互，橫跨語音、文本和視覺，實(shí)現(xiàn)了超低時(shí)延的交互和感知人類情緒。對此，國內(nèi)廠商如何追趕？騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲在接受《每日經(jīng)濟(jì)新聞》記者提問時(shí)表示，多模態(tài)相互融合、實(shí)現(xiàn)端到端的應(yīng)用，其中的難點(diǎn)是三種模態(tài)的特征形態(tài)存在差異。如何將文本的序列化、視覺圖像的二維性、音頻的信號(hào)變化，都影射到同一個(gè)空間里，再去描述它們的特征，這需要算法和技術(shù)上的研究和突破。

吳運(yùn)聲指出，目前在產(chǎn)業(yè)端，大模型的落地還面臨一些挑戰(zhàn)：例如企業(yè)對大模型能力預(yù)期過高、操之過急，因此在企業(yè)需求和大模型能力匹配，以及推進(jìn)節(jié)奏上的協(xié)調(diào)，都需要磨合；再例如，要降低大模型的使用門檻，減少對技術(shù)人才及專業(yè)技術(shù)的能力依賴，讓一線生產(chǎn)、經(jīng)營人員也能“零門檻”用上大模型，才能加速生產(chǎn)經(jīng)驗(yàn)與模型技術(shù)的融合；還有，要提高平臺(tái)適配性，大模型工具既要能匹配、適應(yīng)不斷迭代的大模型技術(shù)，也需要滿足不斷擴(kuò)大的場景需求，滿足可持續(xù)的投入產(chǎn)出比；最后還要保障安全合規(guī)，只有保障生成結(jié)果的安全、準(zhǔn)確，才能滿足企業(yè)對穩(wěn)定性的需求，讓企業(yè)管理者放心加大投入建設(shè)。

（每經(jīng)記者王帆每經(jīng)編輯文多）

全球大模型應(yīng)用百花齊放 騰訊發(fā)布長文模型：單次可處理超38萬字符

全球大模型應(yīng)用百花齊放騰訊發(fā)布長文模型：單次可處理超38萬字符