飛象原創(chuàng)(孫迎新/文)
“突然感覺(jué),我又有信心了,未來(lái)又有希望了!”
當(dāng)兒童圖書(shū)編輯,同時(shí)也是一名語(yǔ)障人士的崔珈瑜看到通過(guò)AI技術(shù)現(xiàn)場(chǎng)對(duì)聲音進(jìn)行修復(fù)的展示后,她興奮與渴望的心情溢于言表,“我希望能夠盡快地?fù)碛兴!?
語(yǔ)障人士 崔珈瑜(圖中左二)
沒(méi)人知道這一天的到來(lái),讓那些在寂靜世界里蟄伏的人們期待了多久。當(dāng)手機(jī)里傳來(lái)清晰流暢的語(yǔ)音時(shí),我們知道,聽(tīng)力障礙人士的世界已經(jīng)悄然改變。他們的心聲,那些曾經(jīng)被沉默掩蓋的渴望,如今正通過(guò)HarmonyOS NEXT的AI聲音修復(fù)功能,清晰地傳達(dá)給每一個(gè)人。這不僅是技術(shù)的突破,更是開(kāi)啟了一段全新的人生體驗(yàn),讓愛(ài)與溫暖在無(wú)聲的世界中流動(dòng)。
這一刻,科技對(duì)障礙群體的深切關(guān)懷和承諾終于成為現(xiàn)實(shí)。對(duì)于聽(tīng)障人士來(lái)說(shuō),最觸動(dòng)心弦的,莫過(guò)于2022年冬殘奧火炬手,同時(shí)也是一位患有先天性極重度耳聾的殘障人士朱軼琳那句再普通不過(guò)的話(huà):“希望社會(huì)大眾能聽(tīng)見(jiàn),聽(tīng)懂我們的聲音!边@不僅是對(duì)清晰交流的渴望,更是對(duì)平等參與社會(huì)生活的向往。
聽(tīng)障人士朱軼琳(圖中左二)
根據(jù)世界衛(wèi)生組織的數(shù)據(jù),全球有超過(guò)10億人的生活因殘障而不便,每7個(gè)人之中,就有1個(gè)人需要無(wú)障礙設(shè)備的幫助。在我國(guó),有超1700萬(wàn)視障者、超2700萬(wàn)聽(tīng)障者、7000萬(wàn)讀寫(xiě)障礙者,還有超過(guò)2億的65周歲以上老年人。許多人因聽(tīng)力障礙而影響了語(yǔ)言學(xué)習(xí)能力,導(dǎo)致不同程度的言語(yǔ)障礙。這些數(shù)據(jù)背后,是一個(gè)個(gè)渴望溝通與理解的靈魂,他們面臨著社交、信息獲取、職場(chǎng)溝通等多重困境。
為了幫助障礙群體實(shí)現(xiàn)平等融入社會(huì)生活的愿望,發(fā)展AI技術(shù)成為大勢(shì)所趨。華為終端發(fā)布的《華為終端可持續(xù)發(fā)展報(bào)告》(2023-2024)中顯示,用技術(shù)創(chuàng)新推動(dòng)可持續(xù)發(fā)展,讓每個(gè)人都平等地融入數(shù)字世界。華為持續(xù)聚焦信息無(wú)障礙、教育與健康、綠色環(huán)保及社會(huì)責(zé)任四大可持續(xù)發(fā)展戰(zhàn)略,并在終端可持續(xù)發(fā)展委員會(huì)的引領(lǐng)下,推動(dòng)各項(xiàng)目標(biāo)的落地。
重生之聲:引領(lǐng)聽(tīng)障人士開(kāi)啟嶄新的語(yǔ)言之旅
黑暗與寂靜或許是這個(gè)世界上最難忍受的苦難。女詩(shī)人艾米莉·狄金森在孤獨(dú)中埋頭寫(xiě)詩(shī)三十年,飽受疾病與身體障礙的困擾,她的詩(shī)中充滿(mǎn)了無(wú)助與失望,同時(shí)也成為障礙人士心態(tài)的真實(shí)寫(xiě)照。
我本可以忍受黑暗
如果我不曾見(jiàn)過(guò)太陽(yáng)
可是那陽(yáng)光,刺破了
我內(nèi)心的荒涼
現(xiàn)實(shí)生活中,聽(tīng)障人士在溝通交流中面臨著巨大的挑戰(zhàn)。他們不僅在社交場(chǎng)合中難以融入,更在工作、教育等重要領(lǐng)域遭遇重重障礙。例如,聽(tīng)障人士在就醫(yī)時(shí)無(wú)法流暢回答醫(yī)生的詢(xún)問(wèn),導(dǎo)致溝通效率低下,甚至耽誤病情的診療;在購(gòu)物或點(diǎn)餐時(shí),他們無(wú)法與店員順暢溝通,只能依賴(lài)文字或手勢(shì),增加了交流的復(fù)雜性和時(shí)間成本;工作場(chǎng)景中,聽(tīng)障人士因無(wú)法用正常的言語(yǔ)與工作伙伴有效溝通,面臨職業(yè)發(fā)展的障礙,面試過(guò)程中因無(wú)法用言語(yǔ)清晰表達(dá)自己的能力和意愿而錯(cuò)失就業(yè)機(jī)會(huì)。
聽(tīng)障人士的語(yǔ)言表達(dá)也會(huì)遇到巨大的困難。由于聽(tīng)力障礙影響他們學(xué)習(xí)和使用語(yǔ)言的能力,他們的發(fā)音往往不準(zhǔn)確,帶有病理性腔調(diào),普通人非常難于識(shí)別理解。這些人士在日常生活和工作中會(huì)遇到各種困難,包括社交、信息獲取、面試、職場(chǎng)溝通等,其中約8成聽(tīng)障人士依靠口語(yǔ)溝通,他們的言語(yǔ)障礙表現(xiàn)為發(fā)音不準(zhǔn)確,韻律、音調(diào)異常,這使得他們?cè)诮涣髦谐3T庥稣`解和歧視。
隨著智能時(shí)代的到來(lái),AI技術(shù)的介入,為聽(tīng)力殘疾障礙人士的語(yǔ)音修復(fù)帶來(lái)了革命性的改變。通過(guò)HarmonyOS NEXT全新的AI聲音修復(fù)功能,可以對(duì)用戶(hù)的語(yǔ)音進(jìn)行實(shí)時(shí)分析、修復(fù)和優(yōu)化,提升用戶(hù)發(fā)音的可懂度和音色的相似性。這項(xiàng)技術(shù)主要針對(duì)四級(jí)和三級(jí)言語(yǔ)障礙人群設(shè)計(jì),通過(guò)構(gòu)建言語(yǔ)障礙人員專(zhuān)用的語(yǔ)音識(shí)別大模型,和業(yè)界領(lǐng)先的語(yǔ)音合成大模型能力,搭建端到端聲音修復(fù)系統(tǒng)。無(wú)需文本輸入,實(shí)現(xiàn)了直接修復(fù)前語(yǔ)音輸入、修復(fù)后語(yǔ)音輸出,并且盡可能地保留了用戶(hù)音色。
通過(guò)AI進(jìn)行語(yǔ)音修復(fù)這項(xiàng)技術(shù)的問(wèn)世來(lái)之不易,華為的研發(fā)團(tuán)隊(duì)在項(xiàng)目初期面臨了巨大的挑戰(zhàn)。由于缺乏前車(chē)之鑒和最基本的數(shù)據(jù),方案無(wú)從下手。但團(tuán)隊(duì)?wèi){借對(duì)無(wú)障礙用戶(hù)的責(zé)任感,決定奮力一搏,沖擊這一個(gè)業(yè)界首創(chuàng)項(xiàng)目。他們收集網(wǎng)上公開(kāi)的言語(yǔ)障礙音視頻,召集各地的言語(yǔ)障礙用戶(hù)進(jìn)行數(shù)據(jù)錄制活動(dòng)。針對(duì)病理性發(fā)音特征,華為在模型結(jié)構(gòu)和方案上進(jìn)行不斷調(diào)整,同時(shí)使用萬(wàn)小時(shí)量級(jí)的高表現(xiàn)力說(shuō)話(huà)人數(shù)據(jù),最大程度地保留大模型的原始能力。
鴻蒙之聲:AI助力障礙人士跨越信息桎梏
在數(shù)字化時(shí)代,信息的自由流通是社會(huì)進(jìn)步的基石。然而,對(duì)于障礙人士來(lái)說(shuō),這個(gè)世界的聲音似乎總是遙不可及。但隨著系列鴻蒙原生智能技術(shù)的誕生,這一群體的信息障礙正逐步被突破。
華為長(zhǎng)期關(guān)注無(wú)障礙建設(shè),致力于通過(guò)系統(tǒng)性的無(wú)障礙建設(shè)工作幫助障礙群體。當(dāng)前,使用華為無(wú)障礙設(shè)備的用戶(hù)規(guī)模接近800萬(wàn)。同時(shí),華為還聯(lián)合全國(guó)200多家聾盲協(xié)會(huì),深入全國(guó)88個(gè)城市開(kāi)展了220多項(xiàng)華為無(wú)障礙功能體驗(yàn)活動(dòng),在線(xiàn)下為障礙人士提供了14000小時(shí)的無(wú)障礙用機(jī)指導(dǎo)與體驗(yàn)服務(wù)。
華為的無(wú)障礙建設(shè)始于產(chǎn)品設(shè)計(jì)之初,要求研發(fā)人員將無(wú)障礙理念落實(shí)在設(shè)計(jì)和開(kāi)發(fā)應(yīng)用的過(guò)程中。自2017年起,華為為有溝通障礙的用戶(hù)提供了AI字幕、小藝通話(huà)、智能問(wèn)答等功能,讓手機(jī)成為用戶(hù)最貼心的助手,而他們的手機(jī)也從可用變成好用,再?gòu)暮糜玫綈?ài)用。
在無(wú)障礙建設(shè)過(guò)程中,鴻蒙原生智能技術(shù)也在不斷得到創(chuàng)新與完善。鴻蒙原生智能技術(shù)的核心在于AI聲音修復(fù)功能,這是一項(xiàng)針對(duì)聽(tīng)力殘疾障礙人士設(shè)計(jì)的創(chuàng)新技術(shù)。
從華為無(wú)障礙“黑科技”,我們也能看到科技以人為本的具體樣子。AI聲音修復(fù)功能利用人工智能技術(shù)對(duì)用戶(hù)的語(yǔ)音進(jìn)行實(shí)時(shí)分析、修復(fù)和優(yōu)化,提升了用戶(hù)發(fā)音的可懂度和音色的相似性;同時(shí),在保持與個(gè)人音色相似的前提下,聲音修復(fù)功能可以大大提升內(nèi)容的可懂度和清晰度,使得言語(yǔ)障礙人士可以更自信地進(jìn)行交流。
通過(guò)這些功能,鴻蒙原生智能技術(shù)為聽(tīng)障人士提供了一個(gè)全新的交流平臺(tái),讓他們能夠更加自信地與世界對(duì)話(huà)。隨著技術(shù)的不斷進(jìn)步和完善,我們有理由相信,未來(lái)將有更多的障礙人士能夠享受到科技帶來(lái)的便利,真正實(shí)現(xiàn)信息的自由流通。
未來(lái)之聲:HarmonyOS NEXT開(kāi)創(chuàng)聲音修復(fù)新紀(jì)元
信息的無(wú)障礙流通是構(gòu)建智能世界的關(guān)鍵,HarmonyOS NEXT以其業(yè)界首創(chuàng)的聲音修復(fù)功能,為聽(tīng)障人士打開(kāi)了一扇通往清晰交流的大門(mén)。
在鴻蒙NEXT發(fā)布會(huì)上,華為終端業(yè)務(wù)首席執(zhí)行官何剛強(qiáng)調(diào)了華為對(duì)于無(wú)障礙科技的長(zhǎng)期承諾,并介紹了HarmonyOS NEXT在聲音修復(fù)方面的突破。何剛表示,華為一直在努力通過(guò)AI技術(shù)解決聽(tīng)障人士的溝通問(wèn)題,從AI字幕到小藝通話(huà),再到現(xiàn)在的AI聲音修復(fù)功能,華為不斷推動(dòng)技術(shù)的發(fā)展,以實(shí)現(xiàn)更自然、更清晰的交流體驗(yàn)。
華為終端業(yè)務(wù)首席執(zhí)行官 何剛
HarmonyOS NEXT的聲音修復(fù)功能是華為在信息無(wú)障礙領(lǐng)域的又一重大創(chuàng)新。這一功能主要針對(duì)四級(jí)和三級(jí)言語(yǔ)障礙人群設(shè)計(jì),利用AI技術(shù)對(duì)用戶(hù)的語(yǔ)音進(jìn)行實(shí)時(shí)分析、修復(fù)和優(yōu)化。通過(guò)構(gòu)建言語(yǔ)障礙人員專(zhuān)用的語(yǔ)音識(shí)別大模型,HarmonyOS NEXT能夠?qū)崟r(shí)分析用戶(hù)的語(yǔ)音,并對(duì)其進(jìn)行修復(fù)和優(yōu)化,提升發(fā)音的可懂度和音色的相似性。
無(wú)需文本輸入是HarmonyOS NEXT聲音修復(fù)功能的一大特點(diǎn),與傳統(tǒng)的語(yǔ)音轉(zhuǎn)文字再合成的方法不同,HarmonyOS NEXT無(wú)需文本輸入最大限度地方便了用戶(hù),實(shí)現(xiàn)了直接從語(yǔ)音輸入到語(yǔ)音輸出的端到端處理。
如果你對(duì)聲音的品質(zhì)有所要求,那保留用戶(hù)音色則讓新生的語(yǔ)音具有更多的親和力。在提升語(yǔ)音可懂度的同時(shí),HarmonyOS NEXT盡可能地保留了用戶(hù)的原始音色,使得交流更加自然,減少了用戶(hù)的陌生感。
語(yǔ)音的最大功能是傳遞信息,因此對(duì)語(yǔ)音含義的理解至關(guān)重要。HarmonyOS NEXT聲音修復(fù)功能顯著提升可懂度。據(jù)華為實(shí)驗(yàn)室數(shù)據(jù)顯示,聲音修復(fù)后可懂度最大提升80%以上,這對(duì)于言語(yǔ)障礙用戶(hù)來(lái)說(shuō)是一個(gè)巨大的進(jìn)步。
在多場(chǎng)景適用性方面,無(wú)論是在生活還是工作中,HarmonyOS NEXT的聲音修復(fù)功能都能幫助言語(yǔ)障礙人士更自信地進(jìn)行面對(duì)面交流。
HarmonyOS NEXT的聲音修復(fù)功能一經(jīng)推出,便受到了業(yè)界的廣泛關(guān)注和積極評(píng)價(jià)?萍荚u(píng)論家和行業(yè)分析師都對(duì)華為在無(wú)障礙科技領(lǐng)域的這一創(chuàng)新表示贊賞。他們認(rèn)為,這不僅是技術(shù)上的突破,更是對(duì)聽(tīng)力殘疾障礙人士社會(huì)參與權(quán)的一次重要提升。
同時(shí),業(yè)界普遍認(rèn)為,HarmonyOS NEXT的聲音修復(fù)功能不僅為聽(tīng)力殘疾障礙人士提供了更好的交流工具,也為整個(gè)社會(huì)創(chuàng)造了更多的包容性和可能性。這一功能的推出,也標(biāo)志著華為在無(wú)障礙科技領(lǐng)域的領(lǐng)導(dǎo)地位,為其他科技公司樹(shù)立了榜樣。
共融之聲:鴻蒙無(wú)障礙體驗(yàn)與生態(tài)建設(shè)的和諧交響
數(shù)字世界不該有人被遺忘,鴻蒙正在打造一個(gè)全新的充滿(mǎn)溫度的智能世界。
無(wú)障礙建設(shè)是華為的長(zhǎng)期責(zé)任,但無(wú)障礙功能的好壞與體驗(yàn)卻是由障礙用戶(hù)說(shuō)了算。華為秉持S.H.A.R.E理念,數(shù)字包容作為華為可持續(xù)發(fā)展的重大戰(zhàn)略之一,號(hào)召更多人參與,積極履行自身職責(zé),創(chuàng)建可持續(xù)、有溫度的數(shù)字未來(lái)。
華為無(wú)障礙始于產(chǎn)品設(shè)計(jì)之初,開(kāi)發(fā)規(guī)范明確要求研發(fā)人員將無(wú)障礙理念落實(shí)在設(shè)計(jì)和開(kāi)發(fā)應(yīng)用的過(guò)程中。華為也始終在更新,并且從未在更新版本中忘記障礙用戶(hù)。
憑借在生態(tài)建設(shè)領(lǐng)域的有力進(jìn)展,鴻蒙無(wú)障礙體驗(yàn)得到了障礙用戶(hù)的高度認(rèn)可。通過(guò)開(kāi)展跨設(shè)備無(wú)障礙體驗(yàn),華為將無(wú)障礙能力向手表、智能眼鏡、筆記本、音箱等設(shè)備擴(kuò)展,滿(mǎn)足障礙用戶(hù)多場(chǎng)景需求,實(shí)現(xiàn)了跨設(shè)備的無(wú)縫協(xié)作。
通過(guò)匯聚更多合作伙伴的廣泛參與,華為與開(kāi)發(fā)者、生態(tài)伙伴共同優(yōu)化復(fù)雜動(dòng)態(tài)頁(yè)面,確保障礙用戶(hù)的使用體驗(yàn)。例如,南方航空在鴻蒙系統(tǒng)上進(jìn)行無(wú)障礙及適老化App頁(yè)面設(shè)計(jì),交通銀行為長(zhǎng)者用戶(hù)打造了手機(jī)銀行App“關(guān)愛(ài)版”,這些服務(wù)正在原生鴻蒙上進(jìn)行適配。
在應(yīng)用市場(chǎng)的無(wú)障礙適配方面,已有超1.5萬(wàn)個(gè)應(yīng)用和元服務(wù)上架HarmonyOS NEXT應(yīng)用市場(chǎng),多家生態(tài)伙伴已適配無(wú)障礙和適老化功能,極大地豐富了鴻蒙生態(tài)的無(wú)障礙體驗(yàn)。
同時(shí),華為還持續(xù)開(kāi)展社區(qū)活動(dòng)和教育,通過(guò)開(kāi)展無(wú)障礙功能體驗(yàn)活動(dòng),提供無(wú)障礙用機(jī)指導(dǎo)與體驗(yàn)服務(wù),發(fā)放《送給爸媽的手機(jī)使用指南》等方式,全方位提升適老化能力,構(gòu)建有溫度的智能世界。
障礙群體的心聲,正在被世界聽(tīng)見(jiàn),通過(guò)技術(shù)的持續(xù)創(chuàng)新,華為在信息無(wú)障礙領(lǐng)域持續(xù)深耕,用科技創(chuàng)新推動(dòng)無(wú)障礙技術(shù)發(fā)展,致力于構(gòu)建一個(gè)全新的充滿(mǎn)溫度的智能世界,讓每個(gè)人都能平等、方便地享受科技發(fā)展帶來(lái)的美好生活。華為終端業(yè)務(wù)首席執(zhí)行官何剛的這些話(huà)如同蕩漾起的陣陣漣漪,傳導(dǎo)到更遠(yuǎn)的地方。
科技,不讓任何一個(gè)人掉隊(duì)。攜手生態(tài)伙伴,共筑更溫暖的數(shù)字未來(lái)。