虎嗅注:今天恰好看到亞馬遜Alexa的超級(jí)碗廣告,亞馬遜創(chuàng)始人、CEO貝佐斯親自出演其中的角色。廣告講述了Alexa突然失聲,亞馬遜不得不找各種替補(bǔ)人員來(lái)代替Alexa回應(yīng)用戶的各種需求,然后各種答非所問(wèn),比如一位用戶問(wèn)Alexa如何烤乳酪三明治,后臺(tái)的工作人員邊運(yùn)動(dòng)邊回應(yīng):「簡(jiǎn)直可悲!你都32歲了!食譜都寫在名字里了,你個(gè)傻X!」還有個(gè)用戶問(wèn):「Alexa,地球到火星有多遠(yuǎn)?」后臺(tái)的一位大姐回答道:「我哪兒知道,我又沒(méi)去過(guò)火星。這個(gè)家伙居然想去火星,圖啥?」(感覺(jué)亞馬遜有借廣告暗諷一心想移民火星的馬斯克的嫌疑)……總之,在鬧出了一系列笑話后,最后Alexa突然又好了,說(shuō):「感謝啦各位,還是讓我來(lái)吧!
這則廣告是為了凸顯亞馬遜人工智能助理Alexa在人類生活中扮演的重要角色。而目前亞馬遜在人工智能的確表現(xiàn)得可圈可點(diǎn)。美國(guó)《連線》雜志則在官網(wǎng)復(fù)盤了亞馬遜是如何引發(fā)人工智能變革的。本文原載于 Wired ,原標(biāo)題為 Inside Amazon's Artificial Intelligence Flywheel ,由微信公眾號(hào)「機(jī)器之能」(ID:almosthuman2017),譯者:Nurhachu Null 、侯韻楚、Edison。
2014年初,Srikanth Thirumalai 見(jiàn)到了亞馬遜 CEO Jeff Bezos。Thirumalai 是一位計(jì)算機(jī)科學(xué)家,2005 年從 IBM 來(lái)到亞馬遜,負(fù)責(zé)公司的推薦團(tuán)隊(duì)。他給 Bezos 提了一個(gè)全新計(jì)劃:將人工智能最新進(jìn)展結(jié)合到部門產(chǎn)品中。
他帶著「六頁(yè)提案」去了。Bezos 很早之前就發(fā)布過(guò)一條命令,產(chǎn)品或服務(wù)推薦必須維持在這個(gè)長(zhǎng)度內(nèi),包含描述最終產(chǎn)品、服務(wù)和計(jì)劃的新聞稿。
當(dāng)時(shí),Bezos 正依靠左右手們將亞馬遜轉(zhuǎn)型為一家人工智能「發(fā)電室」。公司很早就將人工智能技術(shù)用于產(chǎn)品推薦。不過(guò)近年來(lái),這個(gè)領(lǐng)域正在發(fā)生一場(chǎng)變革,機(jī)器學(xué)習(xí)變得越來(lái)越有效,尤其是深度學(xué)習(xí)。深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)、語(yǔ)音和自然語(yǔ)言處理方面引起了巨大的進(jìn)步。
近十年早期,雖然亞馬遜還沒(méi)有明顯利用這些技術(shù)發(fā)展,但意識(shí)到了需求的迫切性。新時(shí)代最激烈的競(jìng)爭(zhēng)將會(huì)是 AI 領(lǐng)域。Google,F(xiàn)acebook,Apple 和 Microsoft 等公司都?jí)合戮揞~賭注。
亞馬遜正在落后!肝覀兒兔總(gè)團(tuán)隊(duì)的負(fù)責(zé)人聊,基本上就是問(wèn)怎么將人工智能技術(shù)應(yīng)用在自身的業(yè)務(wù)中?」亞馬遜設(shè)備和服務(wù)副總裁 David Limp 說(shuō)。
Thirumalai 走心了。他來(lái)到貝索斯的辦公室,談了談自己的年度計(jì)劃,如何更加積極地使用機(jī)器學(xué)習(xí)技術(shù)。但他又覺(jué)得,完全重構(gòu)現(xiàn)在這套精心維護(hù)了 20 年的系統(tǒng),太冒險(xiǎn)。更何況,機(jī)器學(xué)習(xí)表現(xiàn)最佳的領(lǐng)域(比如圖像識(shí)別)和自己的領(lǐng)域(推薦系統(tǒng))并沒(méi)啥關(guān)系。
「還沒(méi)人將深度學(xué)習(xí)技術(shù)應(yīng)用在推薦中,并取得了比我們好很多的而結(jié)果!顾f(shuō)!杆,特別需要信仰上的飛躍!
Thirumalai 還沒(méi)準(zhǔn)備好,不過(guò),Bezos 卻想要更多。
Thirumalai 想用深度學(xué)習(xí)徹底變革既有的推薦系統(tǒng)工作方式。但這就需要一些技術(shù),但自己團(tuán)隊(duì)并沒(méi)有掌握這些技術(shù),連工具都沒(méi)有,甚至還沒(méi)人想出算法。
Bezos 卻喜歡這樣(盡管他那招牌式的笑聲并不能清楚表明,他歡迎這種做法)。于是,Thirumalai 重寫了遍新聞稿,繼續(xù)工作去了。
公司領(lǐng)導(dǎo)層中,Thirumalai 是唯一一位幾年之前,拿著「六 頁(yè)提案」跟隨 Bezos 的。
每位負(fù)責(zé)人認(rèn)為,要針對(duì)不同客戶全體,提供完全不同產(chǎn)品;旧,這些觀點(diǎn)都算是 Thirumalai 提議的變體:使用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)改造亞馬遜部分業(yè)務(wù)。
有些建議涉及到反思既有業(yè)務(wù),比如公司的機(jī)器人、數(shù)據(jù)中心業(yè)務(wù)和亞馬遜云。有的意味著創(chuàng)造全新業(yè)務(wù),例如語(yǔ)音智能家居產(chǎn)品,后來(lái)落地成 Echo。
但結(jié)果的影響力遠(yuǎn)遠(yuǎn)超過(guò)了單個(gè)業(yè)務(wù)項(xiàng)目。Thirumalai 說(shuō),原來(lái)開(kāi)會(huì)時(shí),公司的 AI 人才都被分割開(kāi)了!鸽m然也會(huì)討論、交談,但不會(huì)分享大量技術(shù)和神器,因?yàn)榻?jīng)驗(yàn)教訓(xùn)這些東西很難直接發(fā)揮作用,」他說(shuō)。這些人才就像是工程海洋中的 AI 島嶼。
但借助機(jī)器學(xué)習(xí)變革公司,徹底改變了這一現(xiàn)狀。
雖然每位「六頁(yè)提案」的人都在嚴(yán)格遵守亞馬遜「單線程(single-threaded)」團(tuán)隊(duì)信條,也就是說(shuō),每個(gè)團(tuán)隊(duì)「擁有」他們所采用的技術(shù),但大家開(kāi)始了跨項(xiàng)目協(xié)作。
公司內(nèi)部科學(xué)家負(fù)責(zé)解決重大問(wèn)題,并將解決方案分享給其他團(tuán)隊(duì)。AI 孤島被連接起來(lái),而且隨著公司的 AI 雄心不斷壯大,所面臨的難題也吸引著頂尖人才,尤其是那些想看到自己研究如何影響現(xiàn)實(shí)的人才。這也平衡了亞馬遜對(duì)純研究不感冒的文化,公司過(guò)去要求創(chuàng)新必須完全基于更好地為客戶服務(wù)的語(yǔ)境中。
亞馬遜龐大帝國(guó)運(yùn)轉(zhuǎn)起來(lái),就像一臺(tái)永動(dòng)機(jī)。這是如何做到的?亞馬遜喜歡用「飛輪(flywheel)」這個(gè)詞作答。基于機(jī)器學(xué)習(xí)的創(chuàng)新,會(huì)為其他業(yè)務(wù)團(tuán)隊(duì)提供動(dòng)力;這些團(tuán)隊(duì)通過(guò)打造產(chǎn)品和服務(wù),對(duì)其他團(tuán)隊(duì)產(chǎn)生影響,甚至對(duì)整個(gè)公司產(chǎn)生影響。將公司的機(jī)器學(xué)習(xí)平臺(tái)作為一種付費(fèi)服務(wù)提供給外界,這種努力本身也會(huì)帶來(lái)收益,在某些情況下,甚至能收集更多數(shù)據(jù)進(jìn)一步提升技術(shù)。
將亞馬遜從一家深度學(xué)習(xí)死忠粉公司,轉(zhuǎn)型成一家「發(fā)電室」,需要很多這樣的「六頁(yè)提案」人。整個(gè)公司,都可以看到這一轉(zhuǎn)型效果,包括運(yùn)行在新的機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)上的推薦系統(tǒng)。如今,亞馬遜可以很聰明地推薦下一步讀什么、將什么商品加入購(gòu)物清單,以及今晚可能想看什么電影。
今年,Thirumalai 開(kāi)啟了一項(xiàng)新的工作——領(lǐng)導(dǎo)亞馬遜的搜索部門。他希望將深度學(xué)習(xí)用于服務(wù)的各個(gè)方面。
「如果七八年之前問(wèn)我亞馬遜的 AI 實(shí)力如何,我會(huì)說(shuō),他們沒(méi)有人工智能!谷A盛頓大學(xué)計(jì)算機(jī)科學(xué)的教授 Pedro Domingos 說(shuō),「但他們一直在積極地成長(zhǎng)。正成為一支勁旅。」
或許。
Alexa 效應(yīng)
公司的旗艦人工智能產(chǎn)品是:Echo,以及背后的驅(qū)動(dòng)系統(tǒng)——Alexa 語(yǔ)音平臺(tái)。其實(shí),這些項(xiàng)目也源于一份 2011 年交付給 Bezos 的「六頁(yè)提案」,Operational Plan One 年度計(jì)劃。
其中一位提議高管叫 Al Lindsay,2004 年開(kāi)始在亞馬遜工作。當(dāng)時(shí),他被要求從自己負(fù)責(zé)的團(tuán)隊(duì)轉(zhuǎn)到主要技術(shù)團(tuán)隊(duì),幫助打造全新的產(chǎn)品。
「一款低功耗普適計(jì)算機(jī),大腦在云端,你可以通過(guò)語(yǔ)音與它交互!顾貞浀。
但是,打造這樣一款科幻電影里才有的產(chǎn)品,需要具備一定的 AI 功能,但當(dāng)時(shí)公司就沒(méi)有這方面的人才。雪上加霜的是,那些有技術(shù)能力的專家,只有極少數(shù)愿意為亞馬遜工作。Google 和 Facebook 當(dāng)時(shí)也在搶奪這一領(lǐng)域的頂尖人才。
「我們當(dāng)時(shí)處境很慘!筁indsay 說(shuō)。
「亞馬遜過(guò)去形象不太好,公司對(duì)研究型人才不太友好!笵omingos 說(shuō)。
公司對(duì)客戶不懈關(guān)注以及自身的斗士文化,與對(duì)待學(xué)術(shù)人才的態(tài)度不一致!冈 Google 你是被寵愛(ài)的,而在亞馬遜,你的計(jì)算機(jī)則擺在衣柜上!顾f(shuō)。
更糟糕的是,當(dāng)時(shí)亞馬遜還因公司創(chuàng)新崗位還不如給公司搞包裝的崗位而「聲名遠(yuǎn)播」。
2014 年的一次內(nèi)部聚會(huì)中,機(jī)器學(xué)習(xí)領(lǐng)域頂級(jí)專家 Yann LeCun 在亞馬遜做了一次報(bào)告。當(dāng)時(shí),他已經(jīng)接受了領(lǐng)導(dǎo) Facebook 研究的橄欖枝,但他還是來(lái)做報(bào)告了。
先在一間能容納 600 人的禮堂里做報(bào)告,LeCun 回憶道,然后被帶到了一個(gè)小會(huì)議室,小團(tuán)隊(duì)一個(gè)接一個(gè)來(lái)向他請(qǐng)教問(wèn)題。
但是當(dāng)他向亞馬遜的人提問(wèn)時(shí),他們幾乎一無(wú)所應(yīng)。這讓 LeCun 很無(wú)語(yǔ)。他當(dāng)初選擇 Facebook,部分原因就在于后者愿意開(kāi)源大部分 AI 研究工作。
由于當(dāng)時(shí)公司內(nèi)部沒(méi)有相關(guān)人才,所以亞馬遜開(kāi)始巨資收購(gòu)公司。
「在 Alexa 初期,我們收購(gòu)了很多公司!筁imp 說(shuō)。
2011 年年 9 月,它收購(gòu)了 Yap,這是一家專攻語(yǔ)音文本轉(zhuǎn)換的公司。2012 年年 1 月收購(gòu)了英國(guó)劍橋的 Evi,這家公司軟件可以像 Siri 一樣響應(yīng)用戶的需求。2013 年 1 月收購(gòu)了 Ivona,這家專攻語(yǔ)音合成的波蘭公司,為 Echo 提供了能夠交談的技術(shù)。
但是,亞馬遜的密保文化也妨礙了公司吸引頂尖學(xué)術(shù)人才的努力。
Alex Smola 曾經(jīng)有希望成為亞馬遜的員工,他是這個(gè)領(lǐng)域的巨星,之前在 Yahoo 和 Google 工作過(guò)。
「實(shí)際上,他也是深度學(xué)習(xí)領(lǐng)域教父之一!笹oogle scholar 引用超過(guò)了 90000 次,亞馬遜云深度學(xué)習(xí)和人工智能部門負(fù)責(zé)人 Matt Wood 說(shuō)。
但是,亞馬遜高管甚至不向 Smola 透露他們將要從事的主要工作內(nèi)容。最終 Smola 選擇了卡耐基梅隆大學(xué)的一個(gè)實(shí)驗(yàn)室。
在 Alexa 總監(jiān) Ruhi Sarikaya 和亞馬遜 Alexa 引擎副總裁 Al Lindsay 的領(lǐng)導(dǎo)下,團(tuán)隊(duì)不僅嘗試研發(fā) Echo 系列智能音響,還試圖研發(fā)出能夠與其他公司產(chǎn)品兼容的語(yǔ)音服務(wù)
「即使到產(chǎn)品臨近推出這種關(guān)鍵時(shí)刻,我們面前也擺著巨大的障礙。他們會(huì)嚷嚷:『我憑什么要在亞馬遜工作?我又不想向顧客銷售產(chǎn)品!』」Lindsay 說(shuō)道。
亞馬遜確實(shí)需要有所行動(dòng)。
既然公司是由設(shè)想中的最終產(chǎn)品倒推,那么,產(chǎn)品藍(lán)圖可能會(huì)包含某些尚未發(fā)明的功能!秆芯靠駸嵝汀箍茖W(xué)家對(duì)這些難題興趣十足。其在語(yǔ)音方面需配備能達(dá)到對(duì)話程度的 AI,這個(gè) AI 應(yīng)當(dāng)能對(duì)「喚醒詞」敏感,聽(tīng)取并譯解指令,以及給出盡量合理的答案;而亞馬遜目前無(wú)法做到這一點(diǎn)。
即便沒(méi)有亞馬遜的擁躉,這個(gè)項(xiàng)目也吸引了 Rohit Prasad(波士頓的技術(shù)承包公司 Raytheon BBN 中的一位知名語(yǔ)音識(shí)別科學(xué)家)的注意。(這個(gè)項(xiàng)目使亞馬遜同意他在家鄉(xiāng)建立了自己的團(tuán)隊(duì)。)
他認(rèn)為,亞馬遜專業(yè)化的缺乏是一種特色而非缺陷!高@個(gè)領(lǐng)域充滿希望。谷歌和微軟已經(jīng)在語(yǔ)音方面研究了很多年,而在亞馬遜,我們可以從頭開(kāi)始,抓住并解決所有難題!
自從 2013 年加入亞馬遜以來(lái),他就被委派到了 Alexa 項(xiàng)目中!高@個(gè)設(shè)備以硬件的形式存在,但在語(yǔ)音領(lǐng)域?qū)儆谠缙诩夹g(shù)!顾f(shuō)。
Echo 最棘手的部分便是遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別,這個(gè)問(wèn)題迫使亞馬遜開(kāi)創(chuàng)了新局面,并在此過(guò)程中提升了機(jī)器學(xué)習(xí)技能。
它包括將與麥克風(fēng)存在一段距離的語(yǔ)音指令進(jìn)行譯解,甚至能夠譯解被環(huán)境噪聲或其他細(xì)聲碎語(yǔ)干擾的語(yǔ)音指令。
而具有挑戰(zhàn)性的一個(gè)因素,便是設(shè)備在識(shí)別指令時(shí)不能有延時(shí),它必須極快地將音頻發(fā)送至云端而后產(chǎn)生答案,使彼此之間像在進(jìn)行對(duì)話,而不像處于某些「你不確定對(duì)方是否還活著」的尷尬場(chǎng)合。
若要建立一個(gè)在嘈雜條件下能夠理解并回應(yīng)對(duì)話式查詢指令的系統(tǒng),則需要大量的數(shù)據(jù),即許多人們可能與 Echo 進(jìn)行的不同類互動(dòng)的例子。至于亞馬遜可能會(huì)從何處得到數(shù)據(jù),目前還不可知。
如今許多亞馬遜設(shè)備和第三方產(chǎn)品都在使用 Alexa 語(yǔ)音服務(wù)。而通過(guò) Alexa 所收集的數(shù)據(jù)則有助于改良系統(tǒng),并能增強(qiáng)亞馬遜更廣泛的 AI 服務(wù)
設(shè)備與服務(wù)的副總裁 Limp 說(shuō)道,遠(yuǎn)程技術(shù)早已完成,但「它建立在 Trident 潛艇的鼻錐體上,并且花費(fèi)了十億美元。」亞馬遜試圖讓技術(shù)落地在一款可以放置在廚房柜臺(tái)上的設(shè)備中,它的價(jià)格也必須足夠低廉,才能吸引顧客購(gòu)買這些稀奇古怪的小玩件。
「我們的團(tuán)隊(duì)中,有十分之九的成員認(rèn)為這無(wú)法完成。我們?cè)趤嗰R遜之外有一個(gè)技術(shù)顧問(wèn)委員會(huì),我們沒(méi)有向他們透露正在做什么,但是他們說(shuō)『不管做什么工作都不要繞過(guò)語(yǔ)音識(shí)別!』!筆rasad 說(shuō)。
Prasad 的經(jīng)歷使他堅(jiān)信這能夠做到。但亞馬遜并未提供一個(gè)能將機(jī)器學(xué)習(xí)用于產(chǎn)品開(kāi)發(fā)的可靠系統(tǒng)。
「好消息是,亞馬遜擁有全部必備品——無(wú)可比肩的云服務(wù),裝有 GPU 來(lái)壓縮機(jī)器學(xué)習(xí)算法的數(shù)據(jù)中心,以及知曉如何快速移動(dòng)數(shù)據(jù)的工程師!顾f(shuō)。
他的團(tuán)隊(duì)利用這些部分創(chuàng)建了一個(gè)平臺(tái),平臺(tái)本身便是寶貴的資產(chǎn),其價(jià)值遠(yuǎn)超出「豐富 Echo 的功能」這一使命。
「一旦我們將 Echo 開(kāi)發(fā)為遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別設(shè)備,便有機(jī)會(huì)做的更多,即將 Alexa 的范圍擴(kuò)展到語(yǔ)音服務(wù)當(dāng)中。」Alexa 的資深首席科學(xué)家 Spyros Matsoukas 說(shuō)道。
這位科學(xué)家在 Raytheon BBN 公司,并與 Prasad 合作。(他的工作包括一個(gè)很小眾的 DARPA 項(xiàng)目,稱為 Hub4,該項(xiàng)目利用廣播新聞節(jié)目和被攔截的電話內(nèi)容來(lái)提升語(yǔ)音識(shí)別和自然語(yǔ)言理解能力,這是針對(duì) Alexa 項(xiàng)目的一次大型訓(xùn)練。)他們擴(kuò)展 Alexa 的一個(gè)直接方法,便是允許第三方開(kāi)發(fā)者創(chuàng)建屬于自己的語(yǔ)音技術(shù)迷你應(yīng)用程序(稱為 skills)來(lái)運(yùn)行 Echo 自身。但這僅僅是開(kāi)始。
通過(guò)將 Alexa 應(yīng)用于的 Echo 設(shè)備之外,公司的人工智能文化開(kāi)始融合。整個(gè)公司的團(tuán)隊(duì)開(kāi)始意識(shí)到,Alexa 也可以為他們的小項(xiàng)目提供有用的語(yǔ)音服務(wù)。
「盡管我們?cè)陧?xiàng)目負(fù)責(zé)制方面非常強(qiáng),所有這些數(shù)據(jù)和技術(shù)還是要結(jié)合在一起!筆rasad 說(shuō)。
首先,亞馬遜的其他產(chǎn)品開(kāi)始集成到 Alexa:當(dāng)你在 Alexa 設(shè)備上講話時(shí),你可以訪問(wèn)亞馬遜音樂(lè)(Amazon Music)、Prime Video,來(lái)自亞馬遜購(gòu)物網(wǎng)站的你的個(gè)人推薦和其他服務(wù)。
隨后,這項(xiàng)技術(shù)開(kāi)始在其他亞馬遜領(lǐng)域推廣!敢坏┪覀冇辛嘶镜恼Z(yǔ)言能力,我們就能把它帶給非 Alexa 的產(chǎn)品,比如 Fire TV、語(yǔ)音購(gòu)物、Amazon fresh 的 Dash Wand,以及最終的 AWS。」Lindsay 說(shuō)。
亞馬遜內(nèi)部的人工智能小島正在逐漸聚集成洲。
一旦數(shù)百萬(wàn)用戶(亞馬遜不會(huì)確切地說(shuō)到底有多少)開(kāi)始使用 Echo 和其他一系列 Alexa 驅(qū)動(dòng)的設(shè)備,該公司轉(zhuǎn)型的另一個(gè)關(guān)鍵部分就開(kāi)始了。
亞馬遜開(kāi)始積累大量的數(shù)據(jù),這可能是所有對(duì)話驅(qū)動(dòng)設(shè)備中最大的交互集合。這些數(shù)據(jù)成為潛在雇員的有力誘餌。突然間,亞馬遜迅速躥升成為那些它夢(mèng)寐以求的機(jī)器學(xué)習(xí)專家可能想要工作的地方。
「讓 Alexa 如此吸引我的原因之一是,一旦你在市場(chǎng)上有了一個(gè)設(shè)備,你就有了反饋的資源。不僅是客戶的反饋,而且是真正的數(shù)據(jù),對(duì)于改善一切——尤其是底層平臺(tái)——是如此重要!谷ツ昙尤雭嗰R遜的一位 Alexa 機(jī)器學(xué)習(xí)副總裁 Ravi Jain 說(shuō)。
因此,隨著越來(lái)越多的人使用 Alexa,亞馬遜得到的信息不僅使該系統(tǒng)性能更好,而且還加強(qiáng)了自己的機(jī)器學(xué)習(xí)工具和平臺(tái),并使這家公司成為機(jī)器學(xué)習(xí)科學(xué)家的一個(gè)更熱門的目的地。
飛輪正開(kāi)始旋轉(zhuǎn)。
一個(gè)更具智慧的云端
亞馬遜在 2014 年開(kāi)始向高端客戶銷售 Echo;而同年,Swami Sivasubramanian 對(duì)機(jī)器學(xué)習(xí)入了迷。
當(dāng)時(shí)正在管理 AWS 數(shù)據(jù)庫(kù)及分析業(yè)務(wù)的 Sivasubramanian 正和家人在印度旅行,在時(shí)差和思維千奇百怪的女兒的混合「打擊」下,他開(kāi)始深夜在電腦前研究谷歌的 Tensorflow 和 Caffé這樣的工具,而它們恰恰是 Facebook 和許多學(xué)者青睞的機(jī)器學(xué)習(xí)框架。
他總結(jié)道,將這些工具與亞馬遜的云服務(wù)相結(jié)合可能會(huì)產(chǎn)生巨大的價(jià)值。他使機(jī)器學(xué)習(xí)算法在云端易于運(yùn)行后,認(rèn)為公司可能會(huì)進(jìn)入潛在需求所組成的脈絡(luò)。
「我們每月能夠?yàn)閿?shù)百萬(wàn)開(kāi)發(fā)者提供服務(wù),其中大多數(shù)都沒(méi)有機(jī)器學(xué)習(xí)背景,而不是麻省理工學(xué)院的教授!顾f(shuō)道。
之后 Jeff Bezos 評(píng)論道,他帶著史詩(shī)般的六頁(yè)提案,氣宇軒昂而來(lái)。
從某層面而言,它是向 AWS 增添機(jī)器學(xué)習(xí)服務(wù)的藍(lán)圖;而 Sivasubramanian 卻看的更遠(yuǎn):這是使 AWS 成為所有科技領(lǐng)域機(jī)器學(xué)習(xí)活動(dòng)活躍中心的宏偉愿景。
從某種意義上而言,向數(shù)萬(wàn)亞馬遜的云客戶提供機(jī)器學(xué)習(xí)是不可避免的。
「當(dāng)我們首次將 AWS 的初始商業(yè)計(jì)劃整合到一起時(shí),其任務(wù)便是,采用只有少數(shù)資金雄厚的組織才能實(shí)現(xiàn)的技術(shù),并使其分布盡量廣泛。我們?cè)谟?jì)算、存儲(chǔ)、分析與數(shù)據(jù)庫(kù)方面取得了成功,并且正利用機(jī)器學(xué)習(xí),采取了完全相同的方法!笰WS 的機(jī)器學(xué)習(xí)經(jīng)理 Wood 說(shuō)道。
而能夠吸取公司在其他方面所積累的經(jīng)驗(yàn),則是使 AWS 更加順風(fēng)順?biāo)囊淮蠓▽殹?/P>
Wood 說(shuō),AWS 在 2015 年首次推出的 Amazon Machine Learning 使像 C-Span 這樣的客戶能夠建立私人面部目錄;Zillow 用來(lái)估算房?jī)r(jià),Pinterest 則用于虛擬搜索,并且有幾家自動(dòng)駕駛的初創(chuàng)公司正應(yīng)用 AWS 的機(jī)器學(xué)習(xí),通過(guò)數(shù)百萬(wàn)英里的模擬道路測(cè)試來(lái)改進(jìn)產(chǎn)品。
2016 年,AWS 推出了新的機(jī)器學(xué)習(xí)服務(wù),一個(gè)名為 Polly 的文本到語(yǔ)音組件,以及一個(gè)名為 Lex 的自然語(yǔ)言處理引擎——它們更直接地利用了 Alexa 的創(chuàng)新。
這些產(chǎn)品幫助 AWS 的客戶們建立自己的迷你 Alexa,從 Pinterest 和 Netflix 等巨頭到小型初創(chuàng)公司都可以輕松完成。
涉及視覺(jué)的第三項(xiàng)服務(wù) Rekognition 利用在亞馬遜一個(gè)相對(duì)不太出名的團(tuán)隊(duì) Prime Photos 完成的工作,這個(gè)團(tuán)隊(duì)試圖實(shí)現(xiàn)谷歌、Facebook 和蘋果的照片產(chǎn)品中同樣的深度學(xué)習(xí)功能。
這些機(jī)器學(xué)習(xí)服務(wù)既是強(qiáng)大的收入來(lái)源,也是亞馬遜人工智能飛輪的關(guān)鍵,因?yàn)橹T如美國(guó)國(guó)家航空航天局(NASA)和美國(guó)國(guó)家橄欖球聯(lián)盟(NFL)這樣的來(lái)自各界的客戶都在花錢讓他們的機(jī)器從亞馬遜的數(shù)據(jù)中學(xué)習(xí)。
當(dāng)這些公司能在 AWS 內(nèi)部建立他們的重要機(jī)器學(xué)習(xí)工具時(shí),他們轉(zhuǎn)移到競(jìng)爭(zhēng)對(duì)手的云運(yùn)算平臺(tái)的可能性就變得微乎其微了。(真是抱歉了,谷歌、微軟、或者 IBM)
看看 Infor,這是一家為企業(yè)客戶創(chuàng)建業(yè)務(wù)應(yīng)用程序的價(jià)值數(shù)十億美元的公司。最近,它發(fā)布了一個(gè)名為 Coleman(以電影 Hidden Figures 里 NASA 數(shù)學(xué)家的名字命名)的大規(guī)模新應(yīng)用程序,它允許客戶僅通過(guò)對(duì)話界面來(lái)自動(dòng)化各種過(guò)程、分析公司表現(xiàn),以及與數(shù)據(jù)進(jìn)行交互。它并沒(méi)有從頭構(gòu)建自己的程序,而是使用了 AWS 的 Lex 技術(shù)。
「無(wú)論如何,亞馬遜都在做這個(gè)方面的研究,那么我們?yōu)槭裁匆谶@上面花時(shí)間呢?我們了解我們的客戶,可以讓應(yīng)用程序更適合他們使用。」Infor 的高級(jí)副總裁 Massimo Capoccia 如是說(shuō)。
AWS 在以太領(lǐng)域的主導(dǎo)地位也使其在戰(zhàn)略上優(yōu)于競(jìng)爭(zhēng)對(duì)手,尤其是谷歌,該公司曾希望利用其機(jī)器學(xué)習(xí)的領(lǐng)導(dǎo)力,在云計(jì)算領(lǐng)域趕上 AWS。是的,谷歌可以在服務(wù)器上為客戶提供超快、機(jī)器學(xué)習(xí)優(yōu)化的芯片,但是 AWS 上的公司可以更容易地與那些也在服務(wù)的公司進(jìn)行互動(dòng)和銷售。
「就像 Willie Sutton 說(shuō)他搶銀行是因?yàn)殄X就在那里一樣,」DigitalGlobe 公司的 CTO Walter Scott 在談到他的公司為什么使用亞馬遜的技術(shù)時(shí)說(shuō),「我們使用 AWS 進(jìn)行機(jī)器學(xué)習(xí),因?yàn)檫@是我們的客戶所在!
去年 11 月,在 AWS 的 re:Invent 會(huì)議上,亞馬遜為其客戶推出了一個(gè)更全面的機(jī)器學(xué)習(xí)外延輔助工具:SageMaker,這是一個(gè)復(fù)雜但超級(jí)易用的平臺(tái)。
它的創(chuàng)造者之一正是 Alex Smola,他是機(jī)器學(xué)習(xí)領(lǐng)域的超級(jí)明星,有超過(guò) 9 萬(wàn)次學(xué)術(shù)引用,在五年前曾拒絕了亞馬遜的工作邀請(qǐng)。當(dāng) Smola 決定重返行業(yè)時(shí),他想要幫助創(chuàng)建強(qiáng)大的工具,讓日常軟件開(kāi)發(fā)人員能夠訪用上機(jī)器學(xué)習(xí)。所以他去了他認(rèn)為能讓他產(chǎn)生最大影響力的地方。
「亞馬遜太好了,不能放棄,」他說(shuō),「你可以寫一篇關(guān)于某個(gè)問(wèn)題的論文,但如果你不去實(shí)現(xiàn)它,就沒(méi)人會(huì)真的用你那漂亮的算法!
當(dāng) Smola 告訴 Sivasubramanian,構(gòu)建能夠?qū)C(jī)器學(xué)習(xí)傳播給數(shù)百萬(wàn)人的工具比發(fā)布再多一篇論文更重要時(shí),他得到了一個(gè)驚喜。
「你也可以發(fā)表你的論文!」Sivasubramanian 說(shuō)。
是的,亞馬遜如今在允許其科學(xué)家發(fā)表文章方面更加自由!高@對(duì)招募頂尖人才有很大幫助,同時(shí)也為亞馬遜的研究提供了可看性,」幫助制定了更開(kāi)放立場(chǎng)指南的 Spyros Matsoukas 說(shuō)。
要想知道 AWS 的一百多萬(wàn)用戶是否會(huì)開(kāi)始使用 SageMaker 將機(jī)器學(xué)習(xí)應(yīng)用到他們的產(chǎn)品中,現(xiàn)在還為時(shí)過(guò)早。但是每一個(gè)做過(guò)的客戶都會(huì)發(fā)現(xiàn)自己在亞馬遜上投入良多。
此外,該平臺(tái)非常復(fù)雜,甚至包括 Alexa 團(tuán)隊(duì)在內(nèi)的亞馬遜內(nèi)部人工智能團(tuán)隊(duì)都表示,他們打算成為 SageMaker 客戶,使用這個(gè)本是提供給外部人員的工具。
他們相信,通過(guò)為他們的項(xiàng)目設(shè)立一個(gè)基礎(chǔ),讓他們能夠?qū)W⒂诟呒?jí)的算法任務(wù),這將為他們節(jié)省大量的工作。
即使只有 AWS 的部分客戶使用了 SageMaker,亞馬遜也會(huì)發(fā)現(xiàn)自己的系統(tǒng)性能數(shù)據(jù)豐富許多(當(dāng)然,這不包括客戶自己的機(jī)密信息)。這將帶來(lái)更好的算法、更好的平臺(tái),和更多的客戶。飛輪正在加班加點(diǎn)地工作。
人工智能無(wú)處不在
隨著機(jī)器學(xué)習(xí)的徹底改革,該公司的人工智能技術(shù)已經(jīng)遍布了許多團(tuán)隊(duì),這讓 Bezos 和他的助手們非常滿意。
雖然在亞馬遜沒(méi)有人工智能的中心辦公室,但的確有一個(gè)部門專門負(fù)責(zé)機(jī)器學(xué)習(xí)以及一些將新科學(xué)推進(jìn)公司項(xiàng)目的應(yīng)用研究的推廣和支持。
核心機(jī)器學(xué)習(xí)小組由 Ralf Herbrich 領(lǐng)導(dǎo),在 2012 年被亞馬遜引入之前,他曾在微軟的 Bing 團(tuán)隊(duì)工作,然后在 Facebook 工作了一年。
他說(shuō),在公司內(nèi)部「有一個(gè)擁有這個(gè)社區(qū)的地方是很重要的!梗ó(dāng)然,這支團(tuán)隊(duì)的任務(wù)歸納在了一份 Bezos 批準(zhǔn)的充滿抱負(fù)的六頁(yè)提案上。)
他的部分職責(zé)包括培育亞馬遜快速增長(zhǎng)的機(jī)器學(xué)習(xí)文化。由于該公司以客戶為中心的思路——解決問(wèn)題而不是進(jìn)行理論研究——亞馬遜的高管們承認(rèn),他們的招聘工作總是傾向于那些對(duì)構(gòu)建新事物感興趣的人,而不是那些追求科學(xué)突破的人。
Facebook 的 LeCun 則以另一種方式表達(dá)了同樣觀點(diǎn):「你即使不領(lǐng)導(dǎo)知識(shí)的先鋒,也可以做得很好!
但亞馬遜也在跟隨 Facebook 和谷歌的領(lǐng)導(dǎo),培訓(xùn)其員工在人工智能方面更加熟稔。它開(kāi)設(shè)了關(guān)于機(jī)器學(xué)習(xí)策略的內(nèi)部課程,主辦了一系列內(nèi)部專家的講座。從 2013 年開(kāi)始,該公司每年春天都會(huì)在其總部舉辦一場(chǎng)內(nèi)部機(jī)器學(xué)習(xí)會(huì)議,這是一種亞馬遜內(nèi)部版的 NIPS,NIPS 是最重要的學(xué)術(shù)機(jī)器學(xué)習(xí)平臺(tái)。
「剛開(kāi)始的時(shí)候,亞馬遜的機(jī)器學(xué)習(xí)會(huì)議只有幾百人,而現(xiàn)在已經(jīng)有成千上萬(wàn)的人了,」Herbrich 說(shuō)。
「我們?cè)谖餮艌D最大的會(huì)議室容量也不夠,所以我們把在那里舉辦,然后在園區(qū)里的其他 6 個(gè)會(huì)議室直播!箒嗰R遜的一名高管說(shuō),如果它變得更大,而不是把它稱為一個(gè)亞馬遜的機(jī)器學(xué)習(xí)活動(dòng),而可以被稱為亞馬遜本身了。
Herbrich 的團(tuán)隊(duì)繼續(xù)將機(jī)器學(xué)習(xí)推進(jìn)到公司的一切新業(yè)務(wù)。
例如,執(zhí)行團(tuán)隊(duì)想要更好地預(yù)測(cè)在某一客戶的訂單中應(yīng)該選取 8 個(gè)可選盒子尺寸中的哪一個(gè)時(shí),他們求助于 Herbrich 的團(tuán)隊(duì)。
「那個(gè)實(shí)現(xiàn)團(tuán)隊(duì)不需要有自己的科學(xué)團(tuán)隊(duì),但它需要這些算法,并且需要能夠很容易地使用它們。」他說(shuō)。
在另一個(gè)例子中,David Limp 指出了亞馬遜對(duì)有多少客戶可能會(huì)購(gòu)買新產(chǎn)品的預(yù)測(cè)方法的轉(zhuǎn)變!肝乙呀(jīng)在消費(fèi)電子產(chǎn)品領(lǐng)域工作了 30 年,其中有 25 年的預(yù)測(cè)都是用(人類的)判斷、電子表格和一些魔術(shù)球和飛鏢做的!顾f(shuō),「自從我們開(kāi)始用機(jī)器學(xué)習(xí)來(lái)進(jìn)行預(yù)測(cè),我們的錯(cuò)誤率明顯地下降了!
不過(guò),有時(shí)候 Herbrich 的團(tuán)隊(duì)還是會(huì)將尖端科學(xué)應(yīng)用到一個(gè)問(wèn)題上。
該公司的雜貨遞送服務(wù) Amazon Fresh 已經(jīng)運(yùn)營(yíng)了 10 年,但它需要一種更好的方式來(lái)評(píng)估水果和蔬菜的質(zhì)量——人類的速度太慢且標(biāo)準(zhǔn)不一致。他在柏林的團(tuán)隊(duì)建立了滿是傳感器的硬件和新的算法,為系統(tǒng)加入了觸摸和聞到食物的能力。
「三年后,我們到達(dá)了一個(gè)原型機(jī)階段,可以(比以前)更可靠地判斷質(zhì)量」。
當(dāng)然,這樣的進(jìn)步會(huì)滲透到整個(gè)亞馬遜生態(tài)系統(tǒng)中。
以 Amazon Go 為例,這是一家位于其總部大樓內(nèi)剛剛開(kāi)始向公眾開(kāi)放的、以深度學(xué)習(xí)為動(dòng)力的無(wú)人收銀雜貨店!缸鳛 AWS 的客戶,我們受益于它的規(guī)模,」Amazon Go 的技術(shù)副總裁 Dilip Kumar 說(shuō),「但 AWS 也同樣是個(gè)受益者!
他舉了 Amazon Go 獨(dú)特的流媒體數(shù)據(jù)系統(tǒng)的例子,該系統(tǒng)通過(guò)數(shù)百臺(tái)攝像機(jī)記錄顧客的購(gòu)物活動(dòng)。他的團(tuán)隊(duì)所策劃的創(chuàng)新幫助影響了一項(xiàng)稱為「Kinesis」的 AWS 服務(wù),該服務(wù)讓用戶將視頻從多個(gè)設(shè)備傳送到亞馬遜云,在那里他們可以處理、分析和使用它來(lái)進(jìn)一步推進(jìn)他們的機(jī)器學(xué)習(xí)。
即使亞馬遜的某項(xiàng)服務(wù)尚未使用公司的機(jī)器學(xué)習(xí)平臺(tái),它也可以成為這個(gè)過(guò)程的積極參與者。
亞馬遜的 Prime Air 無(wú)人機(jī)送貨服務(wù)仍處于原型階段,它必須單獨(dú)構(gòu)建人工智能,因?yàn)闊o(wú)人機(jī)無(wú)法依靠云端來(lái)計(jì)算。但它仍能從飛輪上獲得巨大的收益,無(wú)論是從公司的其他方面獲取知識(shí),還是弄清楚使用什么工具。
「我們認(rèn)為這是一個(gè)菜單——每個(gè)人都在分享他們能提供的菜肴,」Prime Air 副總裁 Gur Kimchi 說(shuō)。他預(yù)計(jì),他的團(tuán)隊(duì)最終將擁有自己的美味菜單。
「我們的經(jīng)驗(yàn)教訓(xùn)和我們?cè)?Prime Air 上解決的問(wèn)題無(wú)疑是對(duì)亞馬遜的其他團(tuán)隊(duì)來(lái)說(shuō)有用的!
事實(shí)上,這似乎已經(jīng)發(fā)生了。
「如果有人在公司的某個(gè)部門(比如 Prime Air 或 Amazon Go)看一幅圖片,他們學(xué)到了一些東西,并創(chuàng)造出一種算法,他們就會(huì)和公司里的其他人討論這個(gè)問(wèn)題。于是,我的團(tuán)隊(duì)中的某個(gè)人也可以使用它,比如說(shuō),弄清楚一個(gè)在在執(zhí)行中心移動(dòng)的產(chǎn)品的圖像里有什么。」亞馬遜機(jī)器人(Amazon robotics)的首席科學(xué)家 Beth Marcus 說(shuō)。
一個(gè)以產(chǎn)品為中心的公司是否有可能超越滿是深度學(xué)習(xí)超級(jí)明星的競(jìng)爭(zhēng)對(duì)手?
亞馬遜正為這個(gè)問(wèn)題提供一個(gè)案例。
「雖然他們正在努力趕上,但他們發(fā)布的產(chǎn)品卻令人印象深刻,」艾倫人工智能研究所 (Allen Institute for Artificial Intelligence) 的首席執(zhí)行官 Oren Etzioni 說(shuō),「他們是世界級(jí)的公司,他們創(chuàng)造了世界級(jí)的人工智能產(chǎn)品!
飛輪一直在旋轉(zhuǎn),我們尚未看到很多正在準(zhǔn)備中的「六頁(yè)提案」的影響。但是,更多的數(shù)據(jù),意味著更多的顧客。更好的平臺(tái),意味著更多的人才。
「 Alexa,亞馬遜在人工智能領(lǐng)域現(xiàn)在做得怎么樣?」
回答么?就是 Jeff Bezos 尖尖的笑聲了。