首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

微軟展示Rumi項(xiàng)目,通過(guò)多模方式提高AI理解能力

2023年8月7日 10:24  DoNews  

微軟研究院近日展示了 Project Rumi 項(xiàng)目,結(jié)合文本,音頻和視頻數(shù)據(jù),通過(guò)多模方法,提高人工智能系統(tǒng)的理解能力,從而更能理解人類(lèi)的意圖。

人工智能系統(tǒng)近年來(lái)取得了長(zhǎng)足的進(jìn)步,尤其在自然語(yǔ)言處理(NLP)領(lǐng)域的成長(zhǎng)更為驚人。不過(guò)現(xiàn)有 NLP AI 主要依賴(lài)于文本輸入輸出,忽略了人類(lèi)在自然交流中的語(yǔ)調(diào),面部表情,手勢(shì)和肢體語(yǔ)言等線索,從而在理解方面會(huì)存在偏差。

在 AI 專(zhuān)業(yè)術(shù)語(yǔ)中,這些線索統(tǒng)稱(chēng)為副語(yǔ)言(paralinguistics/ paralanguage)。

微軟研究院為了解決這個(gè)問(wèn)題,開(kāi)發(fā)了 Project Rumi,這是一個(gè)新穎的框架,旨在通過(guò)多模態(tài)副語(yǔ)言提示來(lái)增強(qiáng)人工智能的理解。該項(xiàng)目包括兩個(gè)主要部分:多模式副語(yǔ)言編碼器和多模式副語(yǔ)言解碼器

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話(huà)為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專(zhuān)題
專(zhuān)題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像