計(jì)算機(jī)視覺:我們最需關(guān)注的前沿領(lǐng)域!
幾個(gè)星期前,紐約舉行了LDV視覺峰會(huì)。該峰會(huì)專注于計(jì)算機(jī)視覺的高潛力領(lǐng)域。它涵蓋了從3D成像,VR深入學(xué)習(xí)到Facebook實(shí)時(shí)視頻的各個(gè)領(lǐng)域。這個(gè)領(lǐng)域在各個(gè)行業(yè)都得到密切關(guān)注。
計(jì)算機(jī)視覺的潛力不可小視
LDV峰會(huì)創(chuàng)始人Evan Nisselson在LDV視覺峰會(huì)開場白中表示:現(xiàn)今,被鏈接在一起的相機(jī)和視覺傳感器可以說是無處不在。這些無處不在的錄像和實(shí)時(shí)大數(shù)據(jù),可組合成智慧建筑。其能夠根據(jù)人的運(yùn)動(dòng)量調(diào)節(jié)能量分配。這也將引領(lǐng)智能家園的到來。那時(shí),你的鏡子可以告訴你體重是否增加,你喝了多少酒。這都得益于內(nèi)置的3D掃描儀和氣體傳感器。
而且,一旦這成為現(xiàn)實(shí),鏡中廣告就可以讓你買到低熱量食物以及阿司匹林,并在幾分鐘內(nèi)直接送到浴室交付給你。
計(jì)算機(jī)能看到人類看不見的東西
計(jì)算機(jī)并不只通過我們現(xiàn)在這個(gè)領(lǐng)域所知道的圖像識(shí)別方式來“看”世界(計(jì)算機(jī)通過將圖像分解成像素來認(rèn)知世界)。計(jì)算機(jī)視覺依賴于可實(shí)時(shí)訪問的大數(shù)據(jù),地理定位,傳感器,超聲波,和其他類型的數(shù)據(jù)(如熱成像),可以讓一臺(tái)電腦“看到”人類無法看到的東西:例如氣體,熱量等。
計(jì)算機(jī)視覺的應(yīng)用遠(yuǎn)遠(yuǎn)超過處理大量圖像這個(gè)范疇。它除了快速識(shí)別那些人已經(jīng)可以看到的東西,真正的作用是處理那些人看不到的東西。基于擴(kuò)充內(nèi)存,可以“看”到氣體泄漏。計(jì)算機(jī)視覺通過多個(gè)實(shí)時(shí)渠道將使超人的感覺變?yōu)楝F(xiàn)實(shí)。
目前我們還沒有這種技術(shù)。正如康奈爾大學(xué)計(jì)算機(jī)視覺技術(shù)教授Serge Belongie所說的那樣:“正如你現(xiàn)在看到的計(jì)算機(jī)視覺領(lǐng)域中的狀態(tài),我們無法在人們沒有具象概念的情況下,告訴一個(gè)人某個(gè)東西是什么。我們真能告訴人們的是,像香蕉和自行車這種看見的東西?!钡@就是進(jìn)步,將來計(jì)算機(jī)視覺能夠而且將會(huì)通過照片中提取出來的信息,告訴人們更多的數(shù)據(jù)。
如果我們得不到足夠的訓(xùn)練數(shù)據(jù),我們會(huì)變得停滯不前
深度學(xué)習(xí)網(wǎng)絡(luò),低成本以及更快計(jì)算能力的計(jì)算機(jī),使得判定圖像識(shí)別能力的游戲規(guī)則已經(jīng)被改變。但除非它們有機(jī)會(huì)獲得大量的圖像訓(xùn)練數(shù)據(jù),否則這些輝煌的算法就什么也不是。就說醫(yī)學(xué)影像所面臨的問題:絕大多數(shù)可被用于訓(xùn)練數(shù)據(jù)的圖片是專有的,基本被這兩個(gè)龐然大物所持有:谷歌Facebook??紤]到目前用戶共享和上載在這些公司消費(fèi)平臺(tái)上的數(shù)據(jù)量,這一趨勢沒有明顯放緩的跡象。就像Greylock的合伙人Josh Elman接受記者采訪時(shí)提醒的一樣,它們會(huì)變成計(jì)算機(jī)視覺發(fā)展道路上的潛在障礙,如果兩家大公司一直持有所有的訓(xùn)練數(shù)據(jù)的話。
VR和AR需要計(jì)算機(jī)視覺
一些人認(rèn)為,現(xiàn)在虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)被過度炒作。而把計(jì)算機(jī)視覺帶入這兩項(xiàng)技術(shù)純屬能源浪費(fèi)。不過,VR與AR這兩種技術(shù)都需要長期的發(fā)展。作為進(jìn)一步提升,它們都需要高品質(zhì)的計(jì)算機(jī)視覺功能來完善其技術(shù)(如使用圖像識(shí)別來提高VR 的“互動(dòng)”形式)。
很多人把今天的VR技術(shù)比做90年代中期的互聯(lián)網(wǎng):或許它目前還不是主流可獲利的技術(shù),但在將來會(huì)被廣泛應(yīng)用。計(jì)算機(jī)視覺技術(shù)越是先進(jìn),它的功能將吸引更多的人們來關(guān)注VR和AR,也會(huì)使得其更加實(shí)用并變得可盈利化。
計(jì)算機(jī)視覺已經(jīng)在人身安全方面增加了投入力度
除了深度學(xué)習(xí)和AI,另一項(xiàng)大型科技的發(fā)展趨勢就是機(jī)器人。是的,大多數(shù)機(jī)器人會(huì)需要(并且絕對(duì)需要)計(jì)算機(jī)視覺。從掌管流水線檢驗(yàn)到所做的一切,都會(huì)需要這項(xiàng)技術(shù)。例如,Nanotronics公司使用圖像識(shí)別來尋找計(jì)算機(jī)內(nèi)存晶圓的缺陷,這比使用人類更精確,更快速。
通過LDV視覺峰會(huì)我們可得知,現(xiàn)在仍然是計(jì)算機(jī)視覺發(fā)展的初期。但是,目前的創(chuàng)新有一個(gè)光明的未來,無論是在業(yè)務(wù)層面和更廣泛的社會(huì)層面。研究還證實(shí),令年輕工程師興奮的是:相較以往,會(huì)有更多的機(jī)會(huì)來改變產(chǎn)業(yè)內(nèi)一部分的游戲規(guī)則。