首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 運營 >> 正文

中國電信發(fā)布創(chuàng)新語音識別大模型 支持30種方言混說

2024年5月28日 08:31  環(huán)球網(wǎng)科技  

在近日舉辦的第七屆數(shù)字中國建設峰會上,中國電信人工智能研究院宣布了一項技術突破,發(fā)布了業(yè)內(nèi)首個能同時識別30種方言的語音識別大模型——星辰超多方言語音識別大模型。這一創(chuàng)新技術打破了傳統(tǒng)單一模型僅能識別特定方言的限制,為語言文化的傳承注入了新的活力。

中國是一個語言多樣性極其豐富的國家,“百里不同俗,十里不同音”的現(xiàn)象十分普遍。方言作為地域文化的重要組成部分,其保護和傳承顯得尤為重要。然而,由于方言種類繁多,語法語音特征各異,傳統(tǒng)的方言研究方式依賴大量的人力進行主觀感知和標注,工作量大且標注難以系統(tǒng)化。在此背景下,AI技術的介入無疑為方言的保護和研究帶來變革。

星辰超多方言語音識別大模型的發(fā)布,正是基于AI技術的高效與系統(tǒng)性對方言進行整理歸納的重大成果。該模型不僅能同時識別包括粵語、上海話、四川話、溫州話等在內(nèi)的30多種方言,更在豐富性和質(zhì)量上居于行業(yè)前列。這得益于中國電信人工智能研究院構建的超過30種、總計超過30萬小時的高質(zhì)量方言數(shù)據(jù)庫。

在技術研發(fā)方面,中國電信的研發(fā)團隊首創(chuàng)了“蒸餾+膨脹”聯(lián)合訓練算法,有效解決了在超大規(guī)模多場景數(shù)據(jù)集和大規(guī)模參數(shù)條件下預訓練可能出現(xiàn)的坍縮問題。

目前,星辰語音大模型已在福建、江西、廣西、北京、內(nèi)蒙古等地的中國電信10000智能客服進行試點應用。通過接入星辰大模型,智能客服能夠迅速理解30種方言,日均處理電話量達到約200萬通,極大地提高了服務效率和用戶體驗。此外,該模型還在多個城市的12345市民服務平臺得到應用,為市民提供更加便捷的服務。

星辰超多方言語音識別大模型的發(fā)布和應用,不僅展示了AI技術在語言文化傳承方面的巨大潛力,也為中國電信在人工智能領域的研究和應用增添了新的亮點。 

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國移動李慧鏑:積極推進算力網(wǎng)絡AI注智賦能,推動實現(xiàn)自智網(wǎng)絡“三零三自”愿景
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像