自去年的中興事件,到今天的中美貿(mào)易爭端,有一個(gè)詞始終處在輿論風(fēng)暴的中心:芯片。
圍繞著這個(gè)信息社會(huì)的基礎(chǔ)、讓人愛恨交織的人類技術(shù)結(jié)晶,今天可能隨便拉一個(gè)中國人,都能跟你聊上一陣“卡脖子”、稀土、全球產(chǎn)業(yè)鏈、“實(shí)體名單”。
然而一般來說,如今大家經(jīng)常提到的芯片是指一套計(jì)算設(shè)備最底層的CPU、GPU等等。而事實(shí)上芯片的種類千變?nèi)f化,今天處在中美貿(mào)易爭端和全球技術(shù)變局中的芯片也遠(yuǎn)不止這些“基礎(chǔ)款”。
比如說我們每天都在用,但日常卻并不會(huì)給予太多關(guān)注的“語音芯片”。它的技術(shù)升級和貿(mào)易地位,其實(shí)也已經(jīng)悄然來到了風(fēng)口浪尖上。
聲音背后,也藏著不少關(guān)于芯片的秘密。
躲在聲音背后的小芯片與大國貿(mào)易
所謂語音芯片,或者叫語音IC,是指一臺(tái)電子設(shè)備中負(fù)責(zé)發(fā)出聲音、收錄聲音的處理模塊。
事實(shí)上,這東西在你的家中可謂無處不在。大到電視、電腦、音響,小到手機(jī)、錄音筆、音樂播放器,甚至電磁爐、冰箱、洗衣機(jī)發(fā)出的那一聲“滴”,背后也都需要專門的語音芯片來進(jìn)行控制。
這個(gè)領(lǐng)域聽上去沒什么技術(shù)含量,畢竟今天哪個(gè)設(shè)備還不會(huì)響呢?但事實(shí)上,其背后的設(shè)計(jì)技術(shù)和定制化生產(chǎn)能力,加上龐大的應(yīng)用數(shù)量附帶的低成本要求,多種因素導(dǎo)致了今天中國的語音芯片市場還是主要依靠進(jìn)口。
目前,國內(nèi)語音芯片市場需求中,只有16%左右可以由國內(nèi)廠商來滿足。我國每年要進(jìn)口超過2000億美元的語音芯片產(chǎn)品,這個(gè)數(shù)字超過了我國每年原油進(jìn)口總額。
如果我們把這個(gè)情況帶入今天的中美貿(mào)易爭端大背景中,不難發(fā)現(xiàn)這又是一個(gè)并不安全的“卡脖子”產(chǎn)業(yè)。由于大量依賴進(jìn)口,缺乏底層設(shè)計(jì)技術(shù)和大規(guī)模量產(chǎn)能力,語音芯片一旦被卷入貿(mào)易莫測,很可能對半導(dǎo)體行業(yè),甚至整個(gè)電子產(chǎn)業(yè)帶來連鎖反應(yīng)。
為了擺脫產(chǎn)業(yè)鏈下游的地位,這些年來中國相關(guān)產(chǎn)業(yè)也在進(jìn)行一系列行動(dòng)。比如大規(guī)模收購美國和歐洲的語音芯片企業(yè)與專利技術(shù),但類似收購經(jīng)常被各種因素打斷,流產(chǎn)率遠(yuǎn)大于成功率。
另一方面,今天大陸市場購買的語音芯片,其實(shí)大部分產(chǎn)自日本、韓國和中國臺(tái)灣地區(qū)。在中美貿(mào)易戰(zhàn)的大背景下, 穩(wěn)固和發(fā)展與這些國家和地區(qū)的產(chǎn)業(yè)聯(lián)動(dòng)關(guān)系,也就變得相對重要。
這一領(lǐng)域人才的流動(dòng),近些年也成為大陸發(fā)展語音芯片的新動(dòng)向。比如隨著臺(tái)灣地區(qū)經(jīng)濟(jì)發(fā)展放緩,大量臺(tái)灣的語音芯片人才選擇來大陸工作,客觀上成為推動(dòng)大陸發(fā)展自身產(chǎn)業(yè)鏈的推助劑。
然而在眾多因素中,目前最有可能改變語音芯片全球貿(mào)易結(jié)構(gòu)的,其實(shí)還是新技術(shù)的崛起。從AI到5G,這些我們耳熟能詳?shù)拿直澈,語音芯片迎來了不小的“變數(shù)”。
從AI到5G的跳板
我們知道,傳統(tǒng)意義上的語音芯片只負(fù)責(zé)錄音和播放聲音,其主要難度在于傳輸準(zhǔn)確率、信號穩(wěn)定性等方面。而這兩年一個(gè)新崛起的市場,卻讓“古老”的語音芯片,看到了變化的可能。
那就是AI和智能音箱。2018年,全球智能音箱出貨量達(dá)到了5600萬臺(tái)。而這也意味著數(shù)以千萬計(jì)的芯片市場。
在最開始,智能音箱產(chǎn)品也是用通用CPU來完成計(jì)算任務(wù)處理的,而這個(gè)方式很快暴露出了弊端。由于音箱產(chǎn)品中需要CPU處理的任務(wù)并不多,其能效絕大部分都被浪費(fèi)掉了,而消費(fèi)者卻要承擔(dān)不小的成本。很快行業(yè)達(dá)成了共識(shí),專用的AI語音芯片應(yīng)該是智能音箱的標(biāo)準(zhǔn)配置。
而與傳統(tǒng)語音芯片相比,AI語音芯片主要的不同,是必須增加語音識(shí)別功能。而這涉及到對AI算法的理解,聲音文件的高度壓縮,以及與麥克風(fēng)陣列的新型控制關(guān)系等等。這些能力涉及多個(gè)學(xué)科,是原本語音芯片中并不會(huì)涉及到的全新功能。而新的需求帶來的好消息是,行業(yè)中公司不分大小,國家不問西東,又來到了差不多相同的起跑線上。
而假如這個(gè)市場里,僅僅有一年幾千萬臺(tái)音箱。那么與全球整體語音芯片市場相比,其實(shí)不過是滄海一粟。真正讓AI技術(shù)在語音芯片市場中,引發(fā)更高想象力的因素在于5G。
我們都知道,5G的目標(biāo)在于產(chǎn)業(yè)和行業(yè)應(yīng)用,讓大量物聯(lián)網(wǎng)設(shè)備接入大帶寬低延遲的網(wǎng)絡(luò)。然而讓這些設(shè)備接入網(wǎng)絡(luò)其實(shí)是沒啥用的,至少是用處非常有限。真正5G的價(jià)值,是讓物聯(lián)網(wǎng)設(shè)備可以接入智能交互,讓物聯(lián)網(wǎng)體系可以讀懂人類需求,并基于5G網(wǎng)絡(luò)帶來的實(shí)時(shí)互通帶來整體價(jià)值提升。
舉個(gè)例子,給家里的空調(diào)連上網(wǎng),這本身沒有什么價(jià)值,反正也沒有人爬到空調(diào)那上網(wǎng)。最多不過能讓人遠(yuǎn)程控制空調(diào),而這多半是個(gè)雞肋功能。但是如果給空調(diào)加裝AI,讓人類可以語音控制空調(diào),并且讓空調(diào)理解主人比較復(fù)雜的需求,比如“我肩膀有點(diǎn)冷腿有點(diǎn)熱”,那么物聯(lián)的不可替代性就出現(xiàn)了。這里的人機(jī)交互能力來自于AI,而網(wǎng)絡(luò)基礎(chǔ)建設(shè)于5G。
順著這個(gè)邏輯向下推演,意味著雖然今天音箱是AI語音芯片的核心市場,但未來可能會(huì)讓無數(shù)電子設(shè)備都需要AI語音芯片。甚至于是否有這樣的可能,今天我們其實(shí)已經(jīng)習(xí)慣了所有屏幕都是觸屏,有一兩塊非觸屏都要在旁邊寫清楚。而未來可能每一塊語音芯片都需要是AI語音芯片——人類需要每一個(gè)設(shè)備都不只能發(fā)聲,而是能交流,能理解。
如果這個(gè)邏輯成立的話,那么語音芯片產(chǎn)業(yè)鏈將面臨大規(guī)模洗牌,只能生產(chǎn)傳統(tǒng)語音IC的企業(yè)將無法立足。今天處在產(chǎn)業(yè)變局的原始階段,同時(shí)也是中國語音芯片產(chǎn)業(yè),變革自身產(chǎn)業(yè)鏈位置的最大機(jī)會(huì)之一。
當(dāng)然,瞄準(zhǔn)這個(gè)機(jī)會(huì)的并不只有中國公司,但至少大家的機(jī)會(huì)是相對來說均等的。在此刻,已經(jīng)有幾路人馬殺奔了AI語音芯片這個(gè)剛剛有興起苗頭的市場。
首先是芯片廠商們。隨著智能音箱的崛起,抓住機(jī)會(huì)的芯片廠商又迎來了一輪增長。目前獲利最多的是臺(tái)灣地區(qū)的聯(lián)發(fā)科,在全球智能音箱芯片中占據(jù)了超過70%的市場份額。而大陸的杭州國芯、晶晨科技等芯片企業(yè)也在發(fā)力這一領(lǐng)域。
一般來說,芯片廠商的優(yōu)勢在于AI語音芯片其實(shí)并不需要特別難的技術(shù)門檻,而且對量產(chǎn)能力和成本把控能力具有相當(dāng)強(qiáng)的要求,這些都是芯片企業(yè)的強(qiáng)勢。而對于新技術(shù)的理解,尤其是對AI算法的融合,則成為了芯片廠商的短板,因此與AI公司的合作往往成為了今天的主流。
另一方面,國內(nèi)那些著名的AI獨(dú)角獸也在奔赴AI語音芯片的路上?拼箫w訊、云知聲、出門問問等公司都推出了自己的語音芯片計(jì)劃。AI公司的優(yōu)勢很明顯是在對軟件層的理解,比如對聲音建模、NLP、語義理解等方面,獨(dú)角獸們往往各有秘籍。
另外,由于行業(yè)普遍人為算法公司的業(yè)務(wù)太“輕”,很難在未來獲得長時(shí)間發(fā)展,所以今年的主流故事是算法公司紛紛走向芯片和硬件,把算法集成在芯片中,在產(chǎn)業(yè)上游卡住身位。這一點(diǎn)也加強(qiáng)了AI公司進(jìn)軍芯片的動(dòng)力。
但是AI公司在芯片上的弱勢也是顯而易見的。AI語音芯片并不是個(gè)高凈值產(chǎn)品,往往必須依賴大量生產(chǎn)和大規(guī)模出貨才有可能盈利。而在集成化和工程能力上,AI公司顯然處于弱勢。目前AI獨(dú)角獸們的語音芯片計(jì)劃,更多還停留在對量產(chǎn)的肯定與承諾中。
還有一個(gè)必然出現(xiàn)的玩家,就是巨頭們。Echo的主人亞馬遜已經(jīng)在去年3月公布了自己的AI語音芯片計(jì)劃。有理由相信,熱衷于造AI芯片的巨頭們不會(huì)放過這口蛋糕。目前,谷歌、蘋果等公司都有深入AI語音芯片的可能性。國內(nèi)華為、百度、阿里,也都或多或少傳出了類似消息。
而這里需要注意的是,AI+5G+IoT的組合,雖然打開了語音芯片的新想象力。但是在這個(gè)邏輯里,未來能占據(jù)廣泛市場的芯片模式,絕不是今天智能音箱芯片的模樣。語音芯片本身,變化才剛剛開始。
AIoT道路上的未來語音芯片
基于上文描述的邏輯,未來語音芯片的變革機(jī)會(huì),將基于新網(wǎng)絡(luò)條件下的大批量、全場景設(shè)備擁抱AI。那么符合這樣邏輯的語音芯片產(chǎn)品事實(shí)上還沒有出現(xiàn)。而從這個(gè)角度看,行業(yè)的準(zhǔn)入證依舊沒有停止發(fā)放。
從今天音箱中的AI語音芯片,到未來無處不在的AIoT語音芯片,有這樣幾條變化之路才剛剛開啟:
1、三低芯片。
所謂三低,是指低成本、低功耗,低時(shí)延。5G時(shí)代的物聯(lián)網(wǎng)設(shè)備,理論上來說應(yīng)該是可以長時(shí)間待機(jī),盡量貼近可移動(dòng)化的。因?yàn)樵O(shè)備將部署在海量并發(fā)場景,這也就讓語音芯片的基礎(chǔ)要求是足夠省電和足夠便宜。理想中下一個(gè)階段的語音芯片,是能夠隨時(shí)保持等待喚醒,但在等待喚醒狀態(tài)下極低能耗的。未來的物聯(lián)網(wǎng)芯片、語音芯片、視頻處理芯片,其實(shí)很大一部分競爭將圍繞三低展開。
2、云邊端一體化。
云端一體,這個(gè)詞估計(jì)大家也都聽膩味了。但是沒有辦法,客觀來說,如果我們希望一臺(tái)物聯(lián)網(wǎng)設(shè)備執(zhí)行復(fù)雜且實(shí)時(shí)化的交互和推理,那么它的內(nèi)部必將是本地計(jì)算、云端計(jì)算以及網(wǎng)絡(luò)條件高效配合的。而目前的智能音箱還停留在較簡單的AI任務(wù)層面,語音芯片不需要對云端任務(wù)有太強(qiáng)的理解和配合。而基于目前對未來的想象,本地語音任務(wù)處理,一定會(huì)與云端高效配合,這要求芯片對云端的理解必須加深。尤其在安全層面要求更好的解決方案。
3、能夠復(fù)雜排列與定制的芯片組合。
AIoT設(shè)想中,一個(gè)很重要的因素在于單一場景的智能設(shè)備應(yīng)用,可能是由大量不同能耗、不能功能、不同計(jì)算能力的設(shè)備組合而成的。比如在一家養(yǎng)殖場里,動(dòng)物身上的語音傳感設(shè)備、圍欄柵欄的語音設(shè)備、監(jiān)控系統(tǒng)的語音交互能力,都需要不同的語音功能、語音硬件來完成。于是,這也要求語音芯片的規(guī)格和制式必須復(fù)雜多樣,能夠進(jìn)行基于統(tǒng)一平臺(tái)的互聯(lián)互通。很有可能,接下來語音芯片廠商會(huì)更多與垂直行業(yè)相結(jié)合,在車聯(lián)網(wǎng)、智能家庭、智能醫(yī)療、城市安防等領(lǐng)域出現(xiàn)垂直于行業(yè)的語音芯片廠商。
4、多模態(tài)芯片的到來與崛起。
在AI技術(shù)向產(chǎn)業(yè)化的發(fā)展中,今天一個(gè)很明顯的趨勢在于,多模態(tài)AI能力正在明顯提速。尤其是將語音識(shí)別、語義理解,與機(jī)器視覺任務(wù)相結(jié)合的AI模型。如果想要讓類似任務(wù)計(jì)算效率達(dá)成最優(yōu),那么在芯片端對多模態(tài)的加速就變得十分重要。也許未來我們需要的,是機(jī)器感官芯片,而非語音芯片或者多媒體芯片。
這些發(fā)展邏輯,各自對應(yīng)了新的技術(shù)挑戰(zhàn)與變化機(jī)遇。毫無疑問,今天中國的AI語音雖然看起來紅火,但距離大規(guī)模量產(chǎn)應(yīng)用,以及部分替代目前芯片進(jìn)口需求還有十分漫長的路要走。
類似語音芯片的產(chǎn)業(yè),在中國還有千千萬萬。我們只能勉勵(lì)發(fā)展、聚攏人才,并謀求在新的技術(shù)劇變中發(fā)現(xiàn)調(diào)換座椅的機(jī)會(huì)。
過去我們確實(shí)失去了很多,好在我們還能想象未來。