首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

OpenAI推出聲音克隆新技術(shù):復(fù)刻你的聲音僅需15秒

2024年4月1日 14:00  快科技  

據(jù)媒體報道,OpenAI公司最近推出了一項革命性的聲音克隆技術(shù)——“Voice Engine”。

據(jù)悉,Voice Engine通過文本輸入和15秒的音頻樣本,便能生成與原始說話者聲音極為相似、情感豐富且自然逼真的語音。

這一技術(shù)的研發(fā)始于2022年,并已應(yīng)用于公司現(xiàn)有的文本轉(zhuǎn)語音API和Read Aloud功能中的預(yù)設(shè)語音。

OpenAI認為,Voice Engine技術(shù)對于多個領(lǐng)域具有重大意義。在閱讀輔助和語言翻譯方面,它能夠提供更為自然的語音輸出,增強用戶體驗。

同時,該技術(shù)對于言語障礙患者來說更是一大福音,能夠幫助他們更順暢地交流。例如,在布朗大學(xué)的一個試點項目中,該技術(shù)成功用于創(chuàng)建從學(xué)校項目錄制的音頻中提取的語音克隆,有效幫助了言語障礙學(xué)生。

然而,鑒于合成語音技術(shù)可能存在的濫用風險,OpenAI目前僅對少數(shù)可信合作伙伴開放小規(guī)模測試。通過這種方式,公司旨在深入了解技術(shù)的潛在應(yīng)用,并評估可能帶來的風險。

OpenAI也希望通過此舉引發(fā)社會對合成語音負責任部署的廣泛討論,共同探索如何適應(yīng)這一新型技術(shù)。

此外,為了確保技術(shù)的安全使用,OpenAI還采取了一系列安全措施。這些措施包括使用水印技術(shù)追蹤音頻來源,以及對系統(tǒng)的使用方式進行主動監(jiān)控。

當產(chǎn)品正式推向市場時,公司將設(shè)立一個“禁止語音列表”,以檢測并阻止與名人聲音過于相似的人工智能生成聲音,從而避免潛在的版權(quán)和隱私問題。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
陳忠岳:中國聯(lián)通正在開展6G技術(shù)指標制定等工作
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像