訂閱
糾錯(cuò)
加入自媒體

純視覺(jué)自動(dòng)駕駛會(huì)像人眼一樣“近視”嗎?

在自動(dòng)駕駛領(lǐng)域,純視覺(jué)路線(xiàn)逐漸獲得了一部分從業(yè)者和研究者的認(rèn)可與支持。隨著雙目乃至三目攝像頭方案的應(yīng)用,通過(guò)視差計(jì)算、結(jié)構(gòu)約束和算法建模,攝像頭已經(jīng)具備了一定程度的深度感知能力,使其在自動(dòng)駕駛感知系統(tǒng)中的應(yīng)用場(chǎng)景不斷擴(kuò)展。

正因如此,很多人習(xí)慣將純視覺(jué)自動(dòng)駕駛類(lèi)比為“人眼駕駛”。但從生物視覺(jué)的角度來(lái)看,人眼本身會(huì)受到生理?xiàng)l件限制,存在近視等視力問(wèn)題,那么基于攝像頭的純視覺(jué)自動(dòng)駕駛系統(tǒng),是否也會(huì)出現(xiàn)類(lèi)似“近視”的情況?

什么叫“純視覺(jué)自動(dòng)駕駛”

所謂的純視覺(jué)自動(dòng)駕駛,就是車(chē)輛主要靠攝像頭來(lái)“看世界”,這些攝像頭就像機(jī)器的眼睛一樣,把路上的畫(huà)面、車(chē)道、行人、障礙物等信息傳給自動(dòng)駕駛系統(tǒng),自動(dòng)駕駛系統(tǒng)再根據(jù)這些圖像來(lái)判斷、規(guī)劃和控制車(chē)輛。相較于傳感器融合方案,純視覺(jué)因其成本較低、更接近人眼“看”路,獲得了一大批廠(chǎng)商的支持。

從純視覺(jué)自動(dòng)駕駛的原理上看,好像它的工作原理與人眼看世界的原理很接近,這時(shí)候一定會(huì)有人好奇,既然機(jī)器視覺(jué)和人類(lèi)視覺(jué)這么接近,那機(jī)器視覺(jué)會(huì)不會(huì)像人眼一樣有近視的問(wèn)題?或者說(shuō),會(huì)不會(huì)在某些場(chǎng)景下表現(xiàn)得像近視眼一樣,看不清遠(yuǎn)處或者看不清細(xì)節(jié)?要回答這個(gè)問(wèn)題,得先搞清楚人眼的結(jié)構(gòu)和機(jī)器視覺(jué)的差別。

人眼的視覺(jué)的工作原理與攝像頭工作,還是純?cè)诿黠@差別的,甚至復(fù)雜很多。人眼內(nèi)部有晶狀體、視網(wǎng)膜等復(fù)雜結(jié)構(gòu),通過(guò)肌肉調(diào)節(jié)焦距,從而實(shí)現(xiàn)對(duì)不同距離的物體成像。如果焦距調(diào)節(jié)不好就會(huì)出現(xiàn)近視、遠(yuǎn)視等問(wèn)題。眼睛把二維光線(xiàn)信息傳給大腦,大腦再進(jìn)行重建和理解,最終才形成我們看見(jiàn)和理解的世界。

汽車(chē)上的攝像頭其實(shí)更像一個(gè)固定焦距的相機(jī),它往前裝著,用鏡頭和傳感器把光學(xué)圖像轉(zhuǎn)成數(shù)字信號(hào)。這個(gè)信號(hào)傳到自動(dòng)駕駛系統(tǒng)中后,經(jīng)算法處理成對(duì)周?chē)h(huán)境的理解。這里沒(méi)有天然的“調(diào)節(jié)焦距”的機(jī)制,也不像人類(lèi)視覺(jué)能根據(jù)經(jīng)驗(yàn)、注意力和其他感覺(jué)融合信息,它只是把圖像“看”進(jìn)去然后通過(guò)算法去處理這些像素。

機(jī)器視覺(jué)真的像人眼嗎?

機(jī)器視覺(jué)和人眼其實(shí)不是一回事。人類(lèi)的視覺(jué)系統(tǒng)包括眼睛和大腦兩個(gè)部分,眼睛可以調(diào)焦,能在光線(xiàn)復(fù)雜的情況下靈活適應(yīng),還會(huì)用經(jīng)驗(yàn)和常識(shí)來(lái)推理。而機(jī)器視覺(jué)的“眼睛”只是單純的圖像采集器,它的深度感知、物體識(shí)別、距離估計(jì)全靠算法來(lái)做。單個(gè)攝像頭本身不能直接給出深度信息,因此很多純視覺(jué)自動(dòng)駕駛系統(tǒng)要靠算法估計(jì)距離,或者用多攝像頭、立體視覺(jué)等方式進(jìn)行間接補(bǔ)充。

如果機(jī)器視覺(jué)看不清,不是因?yàn)?ldquo;眼睛近視”,而是因?yàn)閿z像頭本身的物理局限和算法判斷能力出現(xiàn)了問(wèn)題。如在光線(xiàn)很弱或者很強(qiáng)的情況下,攝像頭采集的畫(huà)面會(huì)有噪點(diǎn)或者過(guò)曝,這會(huì)影響后面的感知算法對(duì)物體的識(shí)別和定位。沒(méi)有深度傳感器或者高精度地圖等輔助信息時(shí),算法在某些復(fù)雜場(chǎng)景下的表現(xiàn)就會(huì)像人眼近視一樣,看不清楚東西。這有點(diǎn)類(lèi)似人眼視覺(jué)疲勞時(shí)看不清細(xì)節(jié)的感覺(jué),但本質(zhì)上不是生理近視,而是技術(shù)局限。

人眼能夠快速地判斷物體距離、速度、判斷光影變化、甚至在糟糕環(huán)境下還可以憑經(jīng)驗(yàn)推測(cè)前方情況,而純視覺(jué)系統(tǒng)則要依靠算法從二維圖像里估計(jì)三維信息,這里面會(huì)有誤差和不確定性。這種不確定性可能在某些場(chǎng)景下表現(xiàn)得模糊不清、難以判斷甚至錯(cuò)判,從用戶(hù)的角度看起來(lái),還真就有點(diǎn)像近視時(shí)看遠(yuǎn)處一樣。

純視覺(jué)在什么情況下會(huì)出現(xiàn)“近視”

純視覺(jué)自動(dòng)駕駛在強(qiáng)光直射、逆光、夜間弱光或者霧霾天氣下,攝像頭看到的畫(huà)面質(zhì)量會(huì)急劇下降。畫(huà)面質(zhì)量差了,后面的算法判斷也會(huì)跟著變?cè),可能識(shí)別不出遠(yuǎn)處的障礙物或者錯(cuò)誤估計(jì)距離。這樣的情況在某種程度上和一個(gè)近視的人在沒(méi)有戴眼鏡時(shí)看遠(yuǎn)處模糊的體驗(yàn)有點(diǎn)相似。

同樣的,在沒(méi)有高精度地圖、沒(méi)有輔助雷達(dá)或者激光雷達(dá)等傳感器時(shí),純視覺(jué)系統(tǒng)對(duì)于復(fù)雜街道、快速變化的交通狀況的應(yīng)對(duì)能力也會(huì)下降。在這些長(zhǎng)尾的極端場(chǎng)景下,單靠攝像頭不一定能穩(wěn)定地判斷情況,這本質(zhì)上不是近視,而是缺少可靠的深度感知和補(bǔ)充信息。

還有一點(diǎn)是算法本身的學(xué)習(xí)和泛化能力問(wèn)題。深度學(xué)習(xí)模型是基于大量數(shù)據(jù)訓(xùn)練出來(lái)的,它能很好地處理常見(jiàn)場(chǎng)景,但對(duì)于一些罕見(jiàn)情況或者數(shù)據(jù)沒(méi)覆蓋到的情況,它的判斷可能會(huì)不穩(wěn)定。就像人類(lèi)在突然下雨、大霧或者隧道驟變光線(xiàn)時(shí),會(huì)憑借經(jīng)驗(yàn)和其他感覺(jué)(聽(tīng)覺(jué)、空間記憶)輔助下做出判斷,而純視覺(jué)系統(tǒng)只能根據(jù)畫(huà)面數(shù)據(jù)來(lái)判斷,這就增加了誤判的風(fēng)險(xiǎn)。

機(jī)器視覺(jué)的“限制”能不能被克服?

既然純視覺(jué)自動(dòng)駕駛純?cè)谥T多問(wèn)題,那是否有可行的解決方案?其實(shí)從理論上來(lái)看,可通過(guò)技術(shù)升級(jí)逐步改善,但想完全像人眼一樣,其實(shí)很難。

現(xiàn)在很多自動(dòng)駕駛方案并不只用純視覺(jué),而是融合了激光雷達(dá)、毫米波雷達(dá)等感知硬件與攝像頭一起感知,這樣在視覺(jué)弱的情況下,毫米波雷達(dá)和激光雷達(dá)可以補(bǔ)充距離信息及環(huán)境深度感知。這種融合方案比純視覺(jué)方案更穩(wěn)定。

在算法上,深度學(xué)習(xí)、三維重建、視覺(jué)深度估計(jì)等技術(shù)都在不斷進(jìn)步,現(xiàn)在很多純視覺(jué)系統(tǒng)可以通過(guò)軟件升級(jí)提升對(duì)復(fù)雜場(chǎng)景的理解能力。像是視覺(jué)深度估計(jì)算法,可以從單目圖像推斷出距離信息,或者通過(guò)多攝像頭構(gòu)成立體視覺(jué)來(lái)獲取更準(zhǔn)確的深度。

還有一些新方法嘗試?yán)貌煌ǘ蔚墓鈱W(xué)信息來(lái)補(bǔ)充攝像頭的感知能力,并提高視覺(jué)感知在弱光或復(fù)雜光照條件下的穩(wěn)定性。一種典型的思路是將可見(jiàn)光與近紅外(Near-Infrared,NIR)光譜的數(shù)據(jù)融合在一起,這樣系統(tǒng)不僅能獲取攝像頭看到的圖像,還能利用近紅外光在低光或逆光情況下的成像優(yōu)勢(shì),實(shí)現(xiàn)對(duì)場(chǎng)景中的物體和結(jié)構(gòu)進(jìn)行更全面的感知。

總之,純視覺(jué)自動(dòng)駕駛的感知能力確實(shí)會(huì)不斷提高。未來(lái)可能通過(guò)更強(qiáng)的算法、更高性能的攝像頭、更智能的數(shù)據(jù)融合手段,讓它在絕大多數(shù)路況下做到跟人類(lèi)一樣甚至更好的感知效果。

最后的話(huà)

回到大家最關(guān)心的問(wèn)題,純視覺(jué)自動(dòng)駕駛會(huì)不會(huì)像人眼一樣近視?答案是不會(huì)從生理上“近視”,因?yàn)闄C(jī)器的攝像頭本身沒(méi)有眼球那種可調(diào)焦結(jié)構(gòu);它的感知局限也不是眼睛近視那樣的視覺(jué)模糊,而是技術(shù)層面處理復(fù)雜畫(huà)面和深度信息的難點(diǎn)。

但是在某些光照、天氣或者極端場(chǎng)景下,它的感知結(jié)果可能表現(xiàn)得像“近視”,但隨著算法、硬件和系統(tǒng)融合的進(jìn)步,這些問(wèn)題將逐步改善,但要完全做到像人類(lèi)視覺(jué)那樣靈活、全面,目前仍然有諸多難題需要突破。

-- END --

       原文標(biāo)題 : 純視覺(jué)自動(dòng)駕駛會(huì)像人眼一樣“近視”嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)