視覺(jué)應(yīng)用技術(shù)的展示是今年西南偏南的重要議題。而除了AR、VR、8k等技術(shù)的體驗(yàn)之外,為機(jī)器“看見(jiàn)萬(wàn)物”而鉆研的公司也備受關(guān)注。眼擎科技的CEO朱繼志在西南偏南的舞臺(tái)上分享了他創(chuàng)造這枚中國(guó)“慧眼”的經(jīng)歷心得,以及“AI最后一英里”的“中國(guó)經(jīng)驗(yàn)”。
**給機(jī)器一雙“慧眼”**
2016年5月,美國(guó)一輛電動(dòng)車(chē)特斯拉Model S的車(chē)主,與一輛橫穿路口的卡車(chē)相撞。經(jīng)過(guò)調(diào)查,特斯拉公司認(rèn)為出事車(chē)輛處于自動(dòng)駕駛狀態(tài),至于為什么沒(méi)能在天氣良好的情況下識(shí)別出卡車(chē)而減速或者剎車(chē),電動(dòng)車(chē)公司認(rèn)為在明亮的天空背景下,自動(dòng)駕駛系統(tǒng)皆無(wú)法分辨出開(kāi)車(chē)的白色邊緣。
特斯拉的不幸事故暴露了一個(gè)自動(dòng)駕駛領(lǐng)域的難題,即機(jī)器運(yùn)算能力很高,但是其“視力”和人類(lèi)相比還差的很遠(yuǎn)。而這個(gè)難題不僅局限于汽車(chē),是目前所有機(jī)器和智能設(shè)備的“通病”。
自2014年成立以來(lái),眼擎科技就專(zhuān)注在視覺(jué)成像芯片的研發(fā)上,團(tuán)隊(duì)的目標(biāo)是讓機(jī)器能更清晰的“看到”并感知這個(gè)世界。智能手機(jī)用戶(hù)應(yīng)該都有過(guò)這種經(jīng)歷,當(dāng)拍攝對(duì)象處于逆光時(shí),手機(jī)屏幕上經(jīng)常出現(xiàn)的是一片昏暗不清的畫(huà)面,因?yàn)橄鄬?duì)于人眼的高分辨率和動(dòng)態(tài)范圍,當(dāng)世最好的圖像傳感器也望塵莫及,這也是為什么像自動(dòng)駕駛、無(wú)人機(jī)以及其他使用光學(xué)傳感器作為導(dǎo)航的應(yīng)用都需要避免逆光、強(qiáng)光、弱光等光照環(huán)境。
眼擎科技的視覺(jué)芯片要解決的最核心問(wèn)題,就是要讓機(jī)器能在各種復(fù)雜和極端的光照環(huán)境下,排除光線干擾,生成AI系統(tǒng)能夠使用的可靠圖像。眼擎科技研發(fā)的成像引擎,能夠模擬人類(lèi)眼球?qū)饩的反應(yīng),以超高寬容度處理光比較大的圖像。
在今年年初的極客公園創(chuàng)新大會(huì)上,眼擎科技做了這樣一個(gè)演示:將會(huì)場(chǎng)燈光全部關(guān)閉,僅留臺(tái)上的兩個(gè)屏幕做參考,當(dāng)觀眾已經(jīng)看不到兩個(gè)舉著色卡的模特上臺(tái)時(shí),眼擎科技的機(jī)器不僅能看清模特,而且能準(zhǔn)確識(shí)別出色卡上的顏色。眼擎用這個(gè)測(cè)試證明,其新發(fā)布的「eyemore X42芯片」在弱光環(huán)境下的識(shí)別能力,已經(jīng)超過(guò)人類(lèi)肉眼極限。
**從人眼到機(jī)器眼**
1878年喬治·伊士曼成功研發(fā)出早期的攝影膠片,同時(shí)也讓“柯達(dá)”成為照相的代名詞;一百年后,數(shù)碼相機(jī)誕生,在商用不到二十年的時(shí)間里,迅速取代膠片成為人們保存影像的首選介質(zhì)。
從膠片到比特,雖然用來(lái)存儲(chǔ)影像的介質(zhì)發(fā)生了變化,但有一點(diǎn)不變的是,存儲(chǔ)在不同介質(zhì)上的圖像,最終的使用者都是人類(lèi)。而現(xiàn)在,事情發(fā)生了變化。
根據(jù)BI Intelligence預(yù)測(cè),2020年全球聯(lián)網(wǎng)設(shè)備數(shù)量將達(dá)到340億,其中物聯(lián)網(wǎng)設(shè)備數(shù)量達(dá)到240億,智能手機(jī)、平板電腦、智能手表等傳統(tǒng)移動(dòng)互聯(lián)網(wǎng)設(shè)備數(shù)量?jī)H為100億。對(duì)于海量的物聯(lián)網(wǎng)設(shè)備來(lái)說(shuō),讓它們感知自己所處的環(huán)境,視覺(jué)依然是最重要的方向。而機(jī)器人“看懂”世界的方式,和人類(lèi)不盡相同。這就代表我們此前用來(lái)處理圖像的手段和硬件,已經(jīng)不能滿(mǎn)足新時(shí)代海量機(jī)器的訴求。
在人類(lèi)視覺(jué)時(shí)期,我們關(guān)注的是如何增加更多像素,讓用戶(hù)看起來(lái)更清晰;在機(jī)器時(shí)代,我們需要做的是如何讓圖像能更好的被智能設(shè)備辨認(rèn)出來(lái)。為了能讓機(jī)器“看”的更清晰,我們不僅需要改變傳統(tǒng)的圖像信號(hào)處理方案,而且需要給圖片處理設(shè)備提供足夠的算力、優(yōu)秀的算法和數(shù)據(jù)。最后,我們關(guān)注的焦點(diǎn)應(yīng)該是像素的質(zhì)量,而非數(shù)量。
這也是為什么眼擎科技認(rèn)為,智能圖像處理芯片會(huì)成為一個(gè)必然趨勢(shì),并投身其中。目前,眼擎科技的視覺(jué)芯片已經(jīng)獲得國(guó)內(nèi)多家人工智能和無(wú)人駕駛公司的認(rèn)可。
在不太遙遠(yuǎn)的未來(lái),一個(gè)智能機(jī)器眼中的世界會(huì)是什么樣子的,答案的可能就隱藏在像眼擎科技的視覺(jué)芯片之中。