必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所何寶宏:面向AI,數(shù)據(jù)技術(shù)體系正朝著“數(shù)智融合”方向演進(jìn)

2025年12月13日 17:25CCTIME飛象網(wǎng)

飛象網(wǎng)訊  12月13日,在“2026中國(guó)信通院深度觀察報(bào)告會(huì)”上,中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏就面向AI的數(shù)據(jù)發(fā)展分享了自身思考和見(jiàn)解。

數(shù)據(jù)的規(guī)模、質(zhì)量決定大模型的上限

談及在AI大模型發(fā)展中,數(shù)據(jù)扮演的角色,何寶宏分別從AI和數(shù)據(jù)的發(fā)展兩個(gè)角度進(jìn)行了解答。他表示,早期的人工智能是基于規(guī)則,和數(shù)據(jù)關(guān)系不大;而這一波以大模型為代表的人工智能,數(shù)據(jù)扮演著非常核心的角色。

從數(shù)據(jù)的角度來(lái)看,大數(shù)據(jù)上一波的核心驅(qū)動(dòng)主要是推薦算法,典型的應(yīng)用包括一些用戶畫(huà)像,風(fēng)險(xiǎn)控制、市場(chǎng)獲客等;而這一波數(shù)據(jù)的熱潮主要是以人工智能驅(qū)動(dòng),可以說(shuō)數(shù)據(jù)在這一波人工智能大模型的發(fā)展中,起著非常核心的作用。“數(shù)據(jù)的規(guī)模、數(shù)據(jù)的質(zhì)量決定著大模型的上限,所以能看到數(shù)據(jù)是重中之重!

人工智能發(fā)展對(duì)數(shù)據(jù)提出新的需求和挑戰(zhàn)

2025年以來(lái),人工智能的發(fā)展呈現(xiàn)出一些新特征,對(duì)數(shù)據(jù)也提出了一些新需求。比如語(yǔ)言大模型,它的邊際效應(yīng)遞減已經(jīng)非常明顯,所以語(yǔ)言大模型要進(jìn)一步提高它的能力,就需要更高質(zhì)量的數(shù)據(jù)。另外一方面,除了語(yǔ)言大模型,越來(lái)越多的關(guān)注點(diǎn)開(kāi)始轉(zhuǎn)向了多模態(tài),無(wú)論是對(duì)語(yǔ)言大模型的持續(xù)優(yōu)化,還是對(duì)多模態(tài)模型等數(shù)據(jù)都提出了一些新的需求、新的挑戰(zhàn)。

何寶宏指出,為了進(jìn)一步提高語(yǔ)言大模型的能力,就需要發(fā)展更高質(zhì)量、覆蓋范圍更廣的數(shù)據(jù)。為了提升語(yǔ)言大模型推理能力,圍繞推理甚至應(yīng)用如Agent等,需要結(jié)合場(chǎng)景和應(yīng)用等一些私域的、行業(yè)的、專有的數(shù)據(jù)。對(duì)于多模態(tài)大模型的發(fā)展來(lái)說(shuō),就不能僅僅只有文字類,還需要音頻、視頻等,這些數(shù)據(jù)如何對(duì)齊,在數(shù)據(jù)發(fā)展中也提出新的需求和挑戰(zhàn)。

數(shù)據(jù)技術(shù)正以體系化的方式發(fā)生巨大變革

在何寶宏看來(lái),為應(yīng)對(duì)這些新需求、新挑戰(zhàn),數(shù)據(jù)技術(shù)正以體系化的方式發(fā)生巨大變革。

具體來(lái)看,一方面,現(xiàn)有數(shù)據(jù)體系需面向人工智能進(jìn)行定制化轉(zhuǎn)型與適配。以數(shù)據(jù)治理為例,以往通用的治理模式,如今需結(jié)合人工智能的專用場(chǎng)景進(jìn)行調(diào)整優(yōu)化;即便是已有的DataOps體系,也需要衍生出面向AI的專屬分支(DataOps For AI),重點(diǎn)推進(jìn)數(shù)據(jù)安全治理等相關(guān)工作,本質(zhì)上是現(xiàn)有數(shù)據(jù)領(lǐng)域工作向AI適配的轉(zhuǎn)型。

另一方面,人工智能的發(fā)展也催生了數(shù)據(jù)領(lǐng)域的新情況、新問(wèn)題,這是以往未曾出現(xiàn)的。當(dāng)前這一波人工智能以生成式AI為核心,其生成的結(jié)果本身也屬于數(shù)據(jù)范疇。隨著近年來(lái)生成式AI的快速迭代,如今的數(shù)據(jù)格局已發(fā)生改變——人類產(chǎn)生的數(shù)據(jù)、傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)與AI合成/生成的數(shù)據(jù)日益交融,難以精準(zhǔn)區(qū)分。后續(xù),如何應(yīng)對(duì)AI合成數(shù)據(jù)帶來(lái)的挑戰(zhàn),尤其是如何規(guī)范AI合成數(shù)據(jù)在模型訓(xùn)練與迭代中的應(yīng)用,已成為數(shù)據(jù)領(lǐng)域亟待解決的新課題。

何寶宏進(jìn)一步講到:“除了數(shù)據(jù)資源層面的變化,數(shù)據(jù)技術(shù)層面也需同步迭代升級(jí)!笔苌鲜鰯(shù)據(jù)資源體系變革的驅(qū)動(dòng),數(shù)據(jù)技術(shù)正迎來(lái)一系列新調(diào)整:在數(shù)據(jù)存算領(lǐng)域,宏觀層面上存算架構(gòu)逐步向分布式、存算分離的方向發(fā)展,而面向本地或就近數(shù)據(jù)處理的需求,近存計(jì)算模式也愈發(fā)重要;同時(shí),由于數(shù)據(jù)體量激增,需根據(jù)數(shù)據(jù)“溫度”(熱數(shù)據(jù)、溫?cái)?shù)據(jù)、冷數(shù)據(jù))進(jìn)行分級(jí)存儲(chǔ),對(duì)應(yīng)的存儲(chǔ)介質(zhì)也需隨之優(yōu)化。在數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域,人工智能的發(fā)展同樣提出了新要求——隨著AI向多模態(tài)方向演進(jìn),傳統(tǒng)單模態(tài)數(shù)據(jù)庫(kù)已顯現(xiàn)出效率偏低、成本偏高的問(wèn)題,因此向量數(shù)據(jù)庫(kù)、多模態(tài)數(shù)據(jù)庫(kù)成為技術(shù)升級(jí)的重要方向。

最后,何寶宏強(qiáng)調(diào),受人工智能技術(shù)發(fā)展的驅(qū)動(dòng),當(dāng)前數(shù)據(jù)技術(shù)正經(jīng)歷全方位的巨大變革,其核心目標(biāo)是實(shí)現(xiàn)數(shù)智深度融合。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像