本報記者 張佳星
證件、人臉,掃描對比,綠燈亮,通過,在經(jīng)過高鐵安檢閘口的這一流程時,你也許會想:機器認識我。而實際上,并不是。
“當前的人工智能(AI)識別做的只是比對,缺少信息進入大腦之后的‘加工、理解、思考’步驟,因此僅僅停留在‘感知’,而并非‘認知’!6月18日,紀念吳文俊誕辰一百周年活動的“認知智能行業(yè)應(yīng)用大會”舉行,中國人民大學(xué)高瓴人工智能學(xué)院執(zhí)行院長文繼榮表示,要讓AI有類似大腦的活動,走到認知階段,需要讓它掌握知識、進行推理。AI從“感知智能”走向“認知智能”的實踐目前在通用狀態(tài)下比較困難,但在一些諸如反洗錢、偵察等領(lǐng)域正在應(yīng)用。
AI“大腦”長成要先建知識庫
“現(xiàn)在的AI處于弱人工智能狀態(tài),它沒有大腦,要讓它形成大腦,最核心的是要有‘知識’!
微軟亞洲研究院前研究員、北京一覽群智數(shù)據(jù)科技有限責任公司首席執(zhí)行官胡健表示,如果現(xiàn)有的算法、模型是神經(jīng)或腦結(jié)構(gòu),那么知識是大腦能夠運轉(zhuǎn)起來的原動力。
讓AI獲得知識的知識庫在業(yè)界稱為“知識圖譜”,它不僅要關(guān)注知識點還要關(guān)注知識點間的關(guān)聯(lián)。這些關(guān)聯(lián)將賦予AI聯(lián)想力!疤岬剿磻(yīng)到密度、透明等多個性質(zhì),還要和澆水、能喝的功能聯(lián)系起來,更高級的是計算出用多大力道去取水!焙≌f。
知識圖譜的建立非常困難,人類海量的知識如何翻譯成機器的語言,并與之建立聯(lián)系,很成問題。尤其是之前這項工作一直是人工完成的,例如谷歌詞庫、百度百科、維基百科等都可以轉(zhuǎn)換為知識圖譜,但工作量大、內(nèi)容異常龐雜。
“關(guān)聯(lián)密度不足是另一個難以達到應(yīng)用的‘瓶頸’!焙〗忉專粋知識點可能最多出現(xiàn)在幾個關(guān)系中,能解決比爾·蓋茨的爸爸的鄰居的媽媽這種單維度的問題,但離反映現(xiàn)實世界中“蝴蝶效應(yīng)”里的相互影響還差很遠。
在關(guān)聯(lián)密度不足的情況下,AI的“大腦”即便擁有一個上千萬詞條體量的通用知識圖譜也難以達到應(yīng)用的級別。
行業(yè)知識圖譜能達“認知層面”
知識點的關(guān)聯(lián)密度更像是一個AI大腦皮層,越復(fù)雜密集AI將越“聰明”。
“聚焦到行業(yè),AI可以做到相對聰明一點。”胡健說,一些行業(yè)本身就有自己的基礎(chǔ)關(guān)聯(lián)圖,這為其制定圖譜提供了幫助。例如公安系統(tǒng)有一套體系,包括人、地、事、物、組織、機構(gòu)以及關(guān)聯(lián),將出入境數(shù)據(jù)、第三方物流數(shù)據(jù)等加入進來之后,可固定成知識圖譜。
中國人民公安大學(xué)公共安全行為科學(xué)實驗室主任丁寧介紹,在做入室盜竊、公交扒竊等一些行為規(guī)律的研究時,知識圖譜中除了引入歷史數(shù)據(jù)的發(fā)展態(tài)勢、風險感知之外,還逐步加入了環(huán)境、天氣等數(shù)據(jù),包括PM2.5的值,結(jié)果發(fā)現(xiàn)PM2.5的值對公交扒竊是有影響的。
“我們也提出虛實網(wǎng)絡(luò)結(jié)合的方向,在掌握了實際的社交網(wǎng),和資金流、社交流聯(lián)系之后,我們對于團伙的刻畫就比較準確了!倍幷f,這將大大提高AI通過分析輔助決策的能力。
越密集越準確,AI知識圖譜的關(guān)系圖要做到像“福爾摩斯”一樣綜合分析,要形成凝集大量信息的知識圖譜,這對傳統(tǒng)的人工建立知識圖譜的效率提出了挑戰(zhàn)!盀榇,我們研發(fā)出人工智能的解決方式,能夠自動從海量的多源異構(gòu)數(shù)據(jù)中抽取知識構(gòu)建關(guān)系、理解語義以及與業(yè)務(wù)場景有效結(jié)合,更標準化、效率更高、關(guān)聯(lián)密度能做到更高!焙≌f。
“在此基礎(chǔ)上,我們研究出來跨境資金網(wǎng)絡(luò)可疑交易的一套AI模型!敝行陪y行反洗錢專家沈可生說,它習(xí)得“認知智能”后每年的可疑交易預(yù)警量從50萬份下降到10萬份,減少80%人工甄別的工作量,同時把結(jié)果的準確度提升了80%。