首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

云從科技從容大模型登頂全球多模態(tài)榜單 中國AI領(lǐng)跑通用智能新時代

2025年5月29日 15:45  CCTIME飛象網(wǎng)  

近日,云從科技自主研發(fā)的從容大模型在國際權(quán)威評測平臺OpenCompass最新全球多模態(tài)榜單中,以80.7分的綜合成績登頂榜首。

https://rank.opencompass.org.cn/leaderboard-multimodal/?m=REALTIME

這一成績不僅刷新了國內(nèi)AI模型在國際多模態(tài)測評中的最高得分紀(jì)錄,更超越谷歌、OpenAI等全球頂尖團(tuán)隊(duì),與商湯科技SenseNova(80.4分)、上海AI LAB InternVL(79.1分)占據(jù)前10名的半壁江山,展現(xiàn)了中國在通用人工智能領(lǐng)域的突破性進(jìn)展。

此次評測中,從容大模型展現(xiàn)了全方位技術(shù)優(yōu)勢。面對涵蓋視覺感知、認(rèn)知理解與跨領(lǐng)域應(yīng)用的8大核心數(shù)據(jù)集,該模型在醫(yī)學(xué)健康、數(shù)理邏輯、藝術(shù)設(shè)計等十余個專業(yè)領(lǐng)域表現(xiàn)突出。

尤其在MMBench中文測試、高難度學(xué)科綜合評測(MMMU)及高階推理榜單(MMStar)中均拔得頭籌,并在復(fù)雜場景文本識別(ocrbench)、開放域問答(MMVet)等關(guān)鍵場景中穩(wěn)居全球前列,其綜合能力較國際頭部模型GPT-4.1領(lǐng)先近5分。

技術(shù)突破源于云從科技在多模態(tài)核心領(lǐng)域的持續(xù)深耕。從容大模型聚焦通用視覺語言理解與推理任務(wù),通過三大核心領(lǐng)域(多模態(tài)對齊、高階推理、長上下文建模)的突破性優(yōu)化,構(gòu)建起全球領(lǐng)先的技術(shù)壁壘:

1.多模態(tài)對齊:

自建面向強(qiáng)化指令對齊的高質(zhì)量基準(zhǔn)數(shù)據(jù)集,覆蓋了圖文問答、多模態(tài)理解、多輪交互等任務(wù)場景,提升多模態(tài)理解與任務(wù)指令遵循的推理表現(xiàn)。

2.決策類人化:

首創(chuàng)融合DPO(直接偏好優(yōu)化)與GRPO(生成式獎勵優(yōu)化)的雙重對齊技術(shù),無需依賴獎勵模型即可實(shí)現(xiàn)類人化推理決策,通過優(yōu)化模型學(xué)習(xí)機(jī)制,從容大模型實(shí)現(xiàn)了更貼近人類思維的決策方式,在復(fù)雜問答與多輪交互中展現(xiàn)出更強(qiáng)的智能行為選擇能力;

3.高效工程優(yōu)化

重點(diǎn)攻克了4K高分辨率圖像問答場景,面向多模態(tài)文檔理解(OCR)對模型的圖像編碼器進(jìn)行了結(jié)構(gòu)優(yōu)化,可處理高分辨率圖像與文檔(如合同、發(fā)票表格等),支持多模態(tài)文檔的智能審查、智能解析、智能問答等任務(wù)。

面對跨頁文檔分析、多輪對話等長文本場景,可精準(zhǔn)追蹤超過3萬字的上下文邏輯;

4.原生多模態(tài)推理

模型全面升級,面向多圖、跨圖場景的圖文交錯模式和原生視頻模式,提供原生的多模態(tài)文檔理解和多模態(tài)視頻理解,可以實(shí)現(xiàn)跨圖比較、圖文組合推理、多圖問答等復(fù)雜多模態(tài)任務(wù),進(jìn)而提升大模型大模型的模型理解深度與廣度。

從容大模型多模態(tài)能力示例

目前,該模型已在金融、制造、政務(wù)等多個領(lǐng)域通過AI智能體實(shí)現(xiàn)規(guī);涞。

某銀行基于該模型與云從合作打造風(fēng)控合規(guī)案防智能平臺,構(gòu)建風(fēng)控AI智能體,實(shí)現(xiàn)風(fēng)險識別自動化和問責(zé)標(biāo)準(zhǔn)化,投訴數(shù)量壓降50%以上;在電商領(lǐng)域,云從科技為正浩創(chuàng)新部署的智能客服平臺,通過多模態(tài)對齊與知識庫精準(zhǔn)匹配,將問答準(zhǔn)確率提升至95%,客服月均效率提高24%。

“技術(shù)創(chuàng)新最終要服務(wù)于社會價值。”云從科技聯(lián)合創(chuàng)始人姚志強(qiáng)表示,團(tuán)隊(duì)將持續(xù)探索多模態(tài)技術(shù)的安全落地模式,以自主創(chuàng)新的AI基礎(chǔ)設(shè)施,為全球智能化轉(zhuǎn)型提供更高效、更包容的技術(shù)支撐。

隨著從容大模型的持續(xù)進(jìn)化,中國人工智能正以扎實(shí)的技術(shù)根基,開啟賦能實(shí)體經(jīng)濟(jì)的新篇章。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中興通訊首席發(fā)展官崔麗:數(shù)智賦能 共拓中拉合作新路徑
精彩視頻
2025工業(yè)互聯(lián)網(wǎng)大會 | 深化賦能 工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)成果發(fā)布
2025工業(yè)互聯(lián)網(wǎng)大會 | 六大重要成果發(fā)布 產(chǎn)業(yè)變革再添“強(qiáng)引擎”
工業(yè)互聯(lián)網(wǎng)發(fā)展也太給力了!走,看看到底怎么回事?
中國信通院趙爽:加快工業(yè)互聯(lián)網(wǎng)安全體系建設(shè) 護(hù)航新型工業(yè)化行穩(wěn)致遠(yuǎn)
精彩專題
2025工業(yè)互聯(lián)網(wǎng)大會
2025世界電信和信息社會日大會
第八屆數(shù)字中國建設(shè)峰會
通信產(chǎn)業(yè)2024年業(yè)績盤點(diǎn)
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像