5月17日,騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)在北京召開,公布騰訊大模型應(yīng)用產(chǎn)品的系列進(jìn)展。
這些進(jìn)展包括:發(fā)布具備處理超過38萬字符超長文本能力的長文模型,上線一站式AI智能體創(chuàng)作與分發(fā)平臺(tái)“騰訊元器”,發(fā)布三大引擎工具,預(yù)告C端助手App騰訊元寶發(fā)布時(shí)間。
《每日經(jīng)濟(jì)新聞》記者注意到,長文模型、個(gè)人助手、智能體平臺(tái)都是近期大模型廠商們的競爭焦點(diǎn)。一旦有應(yīng)用在市場(chǎng)激起“水花”,就會(huì)漾起同行的波瀾,推動(dòng)其他廠商跟進(jìn)研究。這樣的氛圍,讓大模型應(yīng)用遭遇了彼此“狹路相逢”的場(chǎng)景。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示:“今天,大家對(duì)于大模型的訴求更加務(wù)實(shí),不僅關(guān)注模型技術(shù)的領(lǐng)先性,也要看怎么融合到業(yè)務(wù)場(chǎng)景,怎么降本增效解決實(shí)際問題!
大廠激戰(zhàn)大模型
這個(gè)5月,全球大模型圈好不熱鬧。OpenAI推出了全能模型GPT-4o,展示了毫秒級(jí)反應(yīng)和多模態(tài)交互的新能力。隨后,谷歌在其I/O開發(fā)者大會(huì)上展示AI助手Astra和旗艦大模型Gemini。
在國內(nèi),阿里云于5月9日正式發(fā)布通義千問2.5。5月15日,字節(jié)跳動(dòng)發(fā)布豆包大模型并挑起“價(jià)格戰(zhàn)”。更早的4月15日,百度推出AgentBuilder、 AppBuilder、ModelBuilder三大開發(fā)工具。
給激戰(zhàn)的5月再添一把“火”的是騰訊。在5月17日舉辦的騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,騰訊公布其大模型的多項(xiàng)新進(jìn)展:基于混元大模型的一站式AI智能體創(chuàng)作與分發(fā)平臺(tái)“騰訊元器”首次亮相,企業(yè)和開發(fā)者可以基于騰訊元器直接創(chuàng)建智能體,使用騰訊官方的插件和知識(shí)庫,還能將這些智能體一鍵分發(fā)到QQ、微信客服、騰訊云等渠道上。騰訊還預(yù)告,基于混元大模型打造的C端助手App“騰訊元寶”將于5月30日發(fā)布。
同時(shí),多個(gè)版本的模型,如hunyuan-pro、hunyuan-standard、hunyuan-lite,通過騰訊云對(duì)外開放,可滿足企業(yè)客戶、開發(fā)者在不同場(chǎng)景下的模型需求,落地最優(yōu)性價(jià)比模型方案。其中hunyuan-standard模型具備256k的超長上下文理解能力,單次處理字符數(shù)超過38萬個(gè)。
騰訊云也專門推出了三款PaaS(平臺(tái)即服務(wù))產(chǎn)品——大模型知識(shí)引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,打造大模型原生工具鏈,助力企業(yè)在知識(shí)服務(wù)、圖像和視頻創(chuàng)作上提質(zhì)提效。
大模型應(yīng)用爆發(fā)?
隨著各大廠商加速推出大模型的細(xì)分應(yīng)用,不少機(jī)構(gòu)判斷,今年大模型應(yīng)用將會(huì)爆發(fā)。
海通國際研報(bào)指出,2024年有望成為國產(chǎn)大模型全面商業(yè)落地的元年,先進(jìn)的大模型能力也將逐漸轉(zhuǎn)化為落地實(shí)際場(chǎng)景的產(chǎn)品應(yīng)用,從而帶動(dòng)大模型在金融、教育、法律、醫(yī)療等眾多垂直行業(yè)的持續(xù)落地,AI2B與AI2C的需求天花板也有望全面打開,在這個(gè)過程中,AI的投資也從映射和跟隨,變?yōu)橐I(lǐng)。
談到大模型的落地應(yīng)用,湯道生在會(huì)上表示,隨著產(chǎn)業(yè)信息的載體多元化,使用者對(duì)模型的需求不僅僅是處理單純的文字,還需要它處理圖片、視頻等多種信息。大模型的能力競爭,正在從單一的文生文,拓展到文生圖、文生視頻、圖生圖、圖生視頻等多模態(tài)能力。
OpenAI日前發(fā)布的AI助手GPT-4o邁向了更自然的人機(jī)交互,橫跨語音、文本和視覺,實(shí)現(xiàn)了超低時(shí)延的交互和感知人類情緒。對(duì)此,國內(nèi)廠商如何追趕?騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲在接受《每日經(jīng)濟(jì)新聞》記者提問時(shí)表示,多模態(tài)相互融合、實(shí)現(xiàn)端到端的應(yīng)用,其中的難點(diǎn)是三種模態(tài)的特征形態(tài)存在差異。如何將文本的序列化、視覺圖像的二維性、音頻的信號(hào)變化,都影射到同一個(gè)空間里,再去描述它們的特征,這需要算法和技術(shù)上的研究和突破。
吳運(yùn)聲指出,目前在產(chǎn)業(yè)端,大模型的落地還面臨一些挑戰(zhàn):例如企業(yè)對(duì)大模型能力預(yù)期過高、操之過急,因此在企業(yè)需求和大模型能力匹配,以及推進(jìn)節(jié)奏上的協(xié)調(diào),都需要磨合;再例如,要降低大模型的使用門檻,減少對(duì)技術(shù)人才及專業(yè)技術(shù)的能力依賴,讓一線生產(chǎn)、經(jīng)營人員也能“零門檻”用上大模型,才能加速生產(chǎn)經(jīng)驗(yàn)與模型技術(shù)的融合;還有,要提高平臺(tái)適配性,大模型工具既要能匹配、適應(yīng)不斷迭代的大模型技術(shù),也需要滿足不斷擴(kuò)大的場(chǎng)景需求,滿足可持續(xù)的投入產(chǎn)出比;最后還要保障安全合規(guī),只有保障生成結(jié)果的安全、準(zhǔn)確,才能滿足企業(yè)對(duì)穩(wěn)定性的需求,讓企業(yè)管理者放心加大投入建設(shè)。
(每經(jīng)記者 王帆 每經(jīng)編輯 文多)