首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

騰訊云副總裁吳運聲:大模型全矩陣產(chǎn)品升級 助力產(chǎn)業(yè)落地

2024年9月6日 15:44  CCTIME飛象網(wǎng)  

9月5日,在2024騰訊全球數(shù)字生態(tài)大會云上智能峰會上,騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲分享了騰訊云在智能領域的最新進展,并探討了大模型在產(chǎn)業(yè)中的應用和未來發(fā)展。

騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲

吳運聲在演講中指出,大模型的發(fā)展呈現(xiàn)出兩個明顯趨勢:模型性能不斷提升和落地場景不斷豐富。他強調(diào),面向場景創(chuàng)造價值才是大模型發(fā)展的意義。基于全矩陣的大模型產(chǎn)品,騰訊已經(jīng)服務了眾多客戶,在知識管理、智能客服、研發(fā)提效、智能營銷、內(nèi)容生成、辦公協(xié)同、風險管控等場景中,幫助企業(yè)實現(xiàn)了降本增效和業(yè)務創(chuàng)新。

騰訊云的大模型策略以實用性為核心,滿足不同企業(yè)在大模型時代的需求。騰訊已經(jīng)構建起了全鏈路的大模型產(chǎn)品矩陣,包括底層基礎設施、幫助企業(yè)訓練專屬模型的TI平臺和行業(yè)大模型解決方案,自研的混元大模型,構建應用的平臺工具,以及基于大模型的各類智能應用。

吳運聲介紹,騰訊最新發(fā)布的混元Turbo版本通過自研的萬億級層間異構MoE技術,相比前代模型實現(xiàn)了訓練效率提升108%,推理效率提升100%,推理成本降低 50%。同時,混元Turbo的效果在多個基準測試上對標GPT-4o,且第三方測評居國內(nèi)第一。

騰訊云在今年5月還一并推出了三款PaaS產(chǎn)品——大模型知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎。經(jīng)過兩個月的迭代,這些產(chǎn)品的能力進一步升級,可以為電商、出海等領域的客服營銷、企業(yè)知識社區(qū)等眾多業(yè)務場景提供效率的助力和創(chuàng)新的支持,也進一步加快了大模型在實際場景中應用落地的速度。

在模型訓練工具方面,為了幫助企業(yè)用戶更便捷地打造專屬模型,人工智能開發(fā)平臺TI平臺也進行了全新升級。在精調(diào)數(shù)據(jù)準備層面,TI平臺全新支持面向多模態(tài)大模型的數(shù)據(jù)集管理和數(shù)據(jù)標注,首創(chuàng)了基于Schema的標注方法,支持用戶自動生成個性化標注工作臺,支持文生文、圖生文、圖文改寫、圖文混合問答等主流場景下的全部細分任務類型。

同時,騰訊云將2D數(shù)智人、3D數(shù)智人和聲音復刻管線全面輸出,支持企業(yè)私有化部署和靈活定制。管線輸出意味著,客戶可以將訓練數(shù)據(jù)和訓練模型都部署在自己的環(huán)境上,推動數(shù)智人在更多場景的普及和落地。

附:演講全文

尊敬的各位嘉賓、媒體朋友們,

大家好!

我是騰訊的吳運聲,很高興在這里跟大家分享騰訊云在智能領域的最新進展和思考。

大模型已經(jīng)發(fā)展了兩年,我們能明顯看到兩個趨勢:一方面,模型性能在不斷提升,圍繞著模型的產(chǎn)品使用門檻也變得更低、更加易用;另一方面,企業(yè)和開發(fā)者積極探索大模型與自身業(yè)務場景的結合,大模型的落地場景不斷豐富、更縱深。我們認為,面向場景創(chuàng)造價值才是大模型發(fā)展的意義。

騰訊的大模型策略,從最開始就以實用為目標,我們希望構建起離產(chǎn)業(yè)最近的AI產(chǎn)品矩陣。從底層的高性能計算、存儲、網(wǎng)絡等AI infra產(chǎn)品,到一站式的人工智能開發(fā)平臺TI和行業(yè)大模型解決方案,再到自研的混元大模型,以及基于大模型的各類工具和智能應用,我們提供了全方位的產(chǎn)品,滿足企業(yè)在大模型時代的各類需求。無論是做大模型的企業(yè),還是想要搭建AI應用的創(chuàng)業(yè)者,還是想利用AI來實現(xiàn)降本增效的企業(yè),都能在騰訊云上找到好用的工具。

去年的生態(tài)大會上,我們正式發(fā)布了全鏈路自研的騰訊混元大模型。經(jīng)過不斷的迭代創(chuàng)新,混元已經(jīng)穩(wěn)居國內(nèi)大模型第一梯隊。

今天,我們正式推出了更快更強的混元Turbo版本,通過自研的萬億級層間異構MoE結構,混元Turbo用更多的專家數(shù)、更少的激活參數(shù)量實現(xiàn)了更好的效果。相比前一代MoE大模型,騰訊混元Turbo的訓練效率提升108%,推理效率提升 1 倍,推理成本降低 50%,僅用一半訓練語料,就實現(xiàn)效果提升14%,中文場景的效果對標GPT-4o。技術創(chuàng)新讓我們可以更多地讓利給客戶,混元Turbo的定價僅為混元Pro版的一半。

在多模態(tài)領域,混元的多項能力也在國內(nèi)保持領先。混元生圖是首個中文原生的DiT架構文生圖開源模型,目前在全網(wǎng)衍生的模型數(shù)量超過2000個。這也充分證明了開發(fā)者對于我們模型能力的認可。

近期,混元還推出了基于 MoE 架構的多模態(tài)理解大模型混元vision。我們在架構、訓練方法和數(shù)據(jù)處理方面進行了創(chuàng)新和深度優(yōu)化,顯著提升了性能,能支持最高 7K 分辨率、最大長寬比16:1的圖片的理解。在近期發(fā)布的中文多模態(tài)大模型 SuperCLUE-V 基準評測中,騰訊混元斬獲國內(nèi)排名第一,超越了多個主流閉源模型。

在自研的混元大模型之外,為了幫助企業(yè)用戶更便捷地打造專屬模型,我們的人工智能開發(fā)平臺TI平臺也進行了全新升級。在精調(diào)數(shù)據(jù)準備層面,我們?nèi)轮С置嫦蚨嗄B(tài)大模型的數(shù)據(jù)集管理和數(shù)據(jù)標注,首創(chuàng)了基于Schema的標注方法,支持用戶自動生成個性化標注工作臺,支持文生文、圖生文、圖文改寫、圖文混合問答等主流場景下的全部細分任務類型。

高質(zhì)量的訓練數(shù)據(jù)是精調(diào)出一個可落地大模型的前提條件。TI 平臺的多模態(tài)數(shù)據(jù)集管理和數(shù)據(jù)標注能力,可提升大模型精調(diào)的數(shù)據(jù)準備效率和訓練數(shù)據(jù)質(zhì)量,從而提升大模型訓練效率和最終效果。

大模型訓練之外,針對OCR和工業(yè)質(zhì)檢場景等垂直訓練場景,我們也對產(chǎn)品進行了升級。OCR場景中,可以實現(xiàn)智能反饋出模糊、反光等場景下的誤識別,水印識別平均準確率提升至95%。在工業(yè)質(zhì)檢場景下,我們?nèi)轮С只赩isual Prompting 的小樣本分割鏈路,并推出缺陷感知通用模型、缺陷自動合成功能,可實現(xiàn)“0” 標注或“1”標注下解決質(zhì)檢問題。

具體到模型工具產(chǎn)品方面,今年5月,我們推出了三個大模型PaaS產(chǎn)品:知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,幫助企業(yè)快速、輕松打造AI原生應用。

大模型知識引擎聚焦企業(yè)知識服務場景。通過該平臺,企業(yè)用自然語言和簡單配置,5分鐘就可以開發(fā)出一款大語言模型應用,服務于客服營銷、企業(yè)知識社區(qū)等業(yè)務場景。經(jīng)過幾個月的產(chǎn)品迭代,知識引擎產(chǎn)品在用戶需求識別與理解、企業(yè)知識處理、檢索和理解能力上,都有很大的升級。

比如,我們綜合運用向量檢索、摘要檢索、text2sql多種技術手段,顯著提升了復雜大表的檢索及問答準確率。同時,我們升級了升級多模態(tài)知識解析、檢索、閱讀理解能力,實現(xiàn)讀懂文中的“數(shù)據(jù)圖”、“自然場景圖”、“圖文關系”。

同時,我們提供了更靈活的購買方式,支持組件能力的單獨輸出,企業(yè)可以按需購買文檔解析、文檔拆分、向量化等能力,按需部署到自身的應用中去。

在圖像創(chuàng)作引擎層面,基于混元生圖能力的升級,我們的圖像風格化、AI寫真、商品背景生成、模特換裝等功能也進一步實現(xiàn)了迭代。在AI寫真層面,我們實現(xiàn)了免訓練技術突破,輸入一張照片后可直接跳過訓練環(huán)節(jié)等待,一鍵生成高清寫真藝術照,整體出圖耗時縮短75%。

針對很多電商商家高頻使用的商品背景生成能力,我們大幅提高了背景畫面真實度、商品分割細膩度,以及商品與背景間融合的自然度與交互合理性,實現(xiàn)商品在不同場景中高度逼真的虛擬效果展示。在模特換裝場景下,我們采用3D先驗方案,提升重建人像效果,在高度保持模特臉部、手部細節(jié)的同時,精確將服裝版型細節(jié)與模特身體特征對齊,確保換裝后的效果逼真自然。

基于混元的DiT架構模型,我們的視頻創(chuàng)作引擎也迎來了全新的升級,新增了圖片跳舞、圖片唱演和視頻轉譯等能力。

首先,我們來看下圖片跳舞能力,目前,我們已經(jīng)實現(xiàn)了單段舞蹈的生成時間從10分鐘下降至1分鐘級別,同時支持轉身、側身等難例舞蹈動作。人物跳舞的自然度已經(jīng)有了很大的提升,這背后是我們基于3d-boby重建技術,進一步優(yōu)化了算法,畫面的真實度和自然度也有了明顯提升。

在圖片唱演層面,我們目前可以支持一張人像圖片生成一段唱演視頻,視頻生成的人物的面部表情和情緒演繹都更加自然靈動。

同時,針對很多客戶有需求的在視頻轉譯能力,我們接入了混元文生文大模型和 TTS 技術,讓轉譯后的視頻能夠保留說話人的音色特征,同時實現(xiàn)說話人口型與目標語種一致的視聽效果。目前視頻轉譯功能支持15+小語種,覆蓋主流外語翻譯,可應用于視頻本地化、跨境電商等場景。

基于騰訊先進的形象驅(qū)動、自然語言理解和識別能力,我們的數(shù)智人形象自然度業(yè)界領先。目前,騰訊云智能數(shù)智人已經(jīng)在業(yè)務辦理、用戶運營、營銷獲客以及品牌宣傳等業(yè)務場景中落地。

今天,我們也將2D數(shù)智人、3D數(shù)智人和聲音復刻管線全面輸出,支持企業(yè)私有化部署和靈活定制。管線輸出意味著,客戶可以將訓練數(shù)據(jù)和訓練模型都部署在自己的環(huán)境上。我們的合作伙伴也可以基于我們的管線能力批量生成數(shù)智人,更好地推動數(shù)智人在更多場景的普及和落地。

基于我們?nèi)仃嚨拇竽P彤a(chǎn)品,我們已經(jīng)服務了眾多客戶,在知識管理、智能客服、研發(fā)提效、智能營銷、內(nèi)容生成、辦公協(xié)同、風險管控等場景中,很多客戶利用我們的產(chǎn)品實現(xiàn)了降本增效和業(yè)務創(chuàng)新。

在智能客服與知識管理場景中,基于大模型的生成能力,可以顯著提升復雜問題的解決效率,提升回答質(zhì)量。比如,汽車售后服務是一個典型的專業(yè)客服場景,涉及的知識復雜,汽車說明書包括圖片、表格等眾多形式,傳統(tǒng)客服機器人無法及時準確地回答問詢。我們與長安汽車共創(chuàng),利用大模型知識引擎整合汽車使用手冊等資料,有效解決了客戶在車輛使用和維護中的疑問,顯著提升了客戶服務體驗。

在智能營銷場景,大模型可以提升廣告素材的生產(chǎn)效率,提升營銷互動的趣味和互動性。比如,蒙牛在一場營銷活動中,利用圖生圖能力,將用戶上傳的全家福轉化生成為特制的卡通畫風,助力會員拉新、提升用戶活躍;顒悠陂g小程序相對于去年同期提升80%以上。

在內(nèi)容創(chuàng)意場景,大模型可以讓內(nèi)容生產(chǎn)的周期大幅縮短,提供更多的創(chuàng)意玩法。比如,人民日報、新華社等媒體結合我們的文生視頻能力,創(chuàng)作了很多視頻作品。過去,視頻內(nèi)容需要一幀幀進行設計和制作,制作周期短則數(shù)天,長則數(shù)月,F(xiàn)在借助視頻生成能力,只需一段文字或者幾張圖片,就能在幾分鐘內(nèi)生成優(yōu)質(zhì)視頻內(nèi)容。

在研發(fā)提效領域,我們一方面提供了TI平臺等工具,幫助易車、閱文等企業(yè)搭建自己的大模型,顯著降低了模型構建的時間和成本;另一方面,通過AI代碼助手等工具,我們也輔助開發(fā)者,提升研發(fā)的效率,幫助企業(yè)提升整體研發(fā)效能。

在辦公協(xié)同場景中,騰訊旗下的企業(yè)微信、騰訊會議、騰訊文檔都已經(jīng)接入了混元大模型。在大模型的助力下,企業(yè)微信可對英文郵件進行智能檢查,輔助英文郵件糾錯,騰訊會議可以自動總結會議紀要,騰訊文檔能夠自動生成各類文檔。這些功能把個體從繁瑣的工作中解放出來,也顯著提升了團隊協(xié)同的效率。

在風險管控領域,風控大模型可以解決傳統(tǒng)風控中建模時間長、效率低的難題。通過打包豐富的反欺詐知識,實現(xiàn)“小樣本”訓練,快速構建契合業(yè)務需求的風控模型體系。比如,東風日產(chǎn)汽車金融,基于少量提示樣本遷移,就完成了適配自身業(yè)務場景的風控模型定制。相比于傳統(tǒng)的建模方式,模型KS性能提升超過20%,在跨場景的泛化性測試上性能提升53%。

今天我們也很榮幸請來了很多客戶來分享他們的落地實踐。未來,我們也希望與更多客戶攜手,推動大模型落地到場景中,真正為企業(yè)創(chuàng)造價值!謝謝大家!

編 輯:T01
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡的實踐和展望
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像