訂閱
糾錯
加入自媒體

自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡嗎?

2026-04-20 11:11
智駕最前沿
關注

在自動駕駛的視覺感知領域,占用網(wǎng)絡(Occupancy Network)風頭正勁,大有取代傳統(tǒng)目標檢測方案的勢頭。在最近一篇交流占用網(wǎng)絡的文章中,有小伙伴提問,自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡(CNN)嗎?

對于這個問題我們需要先厘清它們在整個系統(tǒng)里扮演的角色。占用網(wǎng)絡在自動駕駛中更像是一種對世界的表達方式,而CNN則是處理圖像信息的基礎工具。這兩者之間并不是非此即彼的替代關系,而是各司其職。

傳統(tǒng)的視覺識別是怎么工作的?

在占用網(wǎng)絡流行之前,自動駕駛的主流感知方案是基于CNN的目標檢測。你可以把它想象成給攝像頭拍到的每一張照片畫框。

當攝像頭拍攝到前方的道路,CNN會通過一層層的卷積運算,從像素中提取出邊緣、紋理、形狀等特征。如果它發(fā)現(xiàn)某個區(qū)域的特征符合它學習過的車或者人的特征,就會在該位置打上一個標簽,并給出一個矩形框。

卷積神經網(wǎng)絡架構

這種方式在處理標準物體時效率非常高,因為它直接告訴了系統(tǒng)前方多遠有一輛車。

然而,單純依靠畫框的方案存在一個明顯的短板,就是它很難處理那些沒見過的物體。

如果路面上掉落了一個形狀奇特的塑料桶,或者有一輛側翻的運載奇形怪狀建筑材料的卡車,傳統(tǒng)的CNN目標檢測模型可能會因為找不到匹配的特征而漏檢。

這是因為這類模型本質上是在做分類題,如果題目超出了它的知識庫,它就可能選擇視而不見。這種漏檢對于追求極致安全的自動駕駛來說,顯然是不可接受的。

為什么需要占用網(wǎng)絡?

為了解決這種“長尾問題”,占用網(wǎng)絡應運而生。它不再試圖去分辨前方到底是車還是樹,而是直接把三維空間切成無數(shù)個微小的方格,也就是我們常說的體素。

占用網(wǎng)絡的目標非常單純,那就是判斷每一個方格是被占據(jù)了,還是空閑的。

通過這種方式,感知系統(tǒng)就能構建出一個實時的三維物理世界模型。在這個模型里,哪怕前方是一堆亂七八糟的雜物,只要它占據(jù)了空間,占用網(wǎng)絡就會把它標記為不可通行。

這種從做分類題到做空間判斷題的轉變,極大地提升了自動駕駛對未知環(huán)境的適應能力。它不再依賴于復雜的物體標簽,而是回歸到了物理世界的本質。

通過占用網(wǎng)絡,車輛可以更精準地感知物體的邊緣、高度和深度,甚至能預測物體在空間中的運動趨勢。

這不僅解決了漏檢奇形怪狀物體的問題,也為車輛的規(guī)控系統(tǒng)提供了更干凈、更立體的環(huán)境地圖。

占用網(wǎng)絡和CNN是替代關系嗎?

既然占用網(wǎng)絡這么厲害,那CNN是不是就可以不再使用了呢?答案是否定的。實際上,目前的占用網(wǎng)絡架構中,CNN依然發(fā)揮著不可替代的基礎作用。

我們要明白,占用網(wǎng)絡處理的是三維空間的占用情況,但傳感器的輸入,尤其是攝像頭拍攝的原始畫面,依然是二維的像素點。

要把這些雜亂的像素變成有意義的特征,最成熟、最高效的手段依然是CNN。

在目前的感知流程中,CNN充當著骨干網(wǎng)絡的角色。攝像頭捕獲圖像后,首先由CNN進行初步的特征提取,把圖像轉化成高維的特征向量。這些特征向量里包含了物體的顏色、紋理、明暗變化等關鍵信息。

隨后,這些信息才會被送入后續(xù)的模塊(比如Transformer或跨空間映射模塊),轉化成三維空間下的占用概率。

換句話說,CNN負責看,它提供了感知的素材;而占用網(wǎng)絡負責想,它基于這些素材把世界構造成三維的模樣。

未來的感知架構會如何演進?

雖然CNN目前依然穩(wěn)坐骨干網(wǎng)絡的寶座,但自動駕駛的感知架構確實在發(fā)生變化。隨著計算硬件的升級,一些原本由CNN承擔的任務正在向Transformer轉移,尤其是在處理多攝像頭融合和長時序信息時,Transformer表現(xiàn)出了更強的全局建模能力。

但這并不意味著CNN會徹底消失。在一些對實時性要求極高、計算資源相對有限的邊緣處理任務上,CNN憑借其局部特征提取的極高效率,依然具有很強的競爭力。

未來的自動駕駛感知系統(tǒng),大概率會是一種多種技術深度融合的狀態(tài)。CNN可能會繼續(xù)在底層處理圖像像素,通過輕量化的設計快速提取基礎特征;而占用網(wǎng)絡則在更高層級上統(tǒng)領全局,把來自不同傳感器的數(shù)據(jù)整合成統(tǒng)一的空間模型。

在這個進化的過程中,占用網(wǎng)絡并沒有淘汰CNN,而是把CNN從繁重的畫框任務中解放了出來,讓它回歸到最擅長的圖像特征提取工作中。

兩者的結合,讓自動駕駛汽車能夠不僅看清路上的物體,更能真正讀懂這個立體的物理世界。

-- END --

       原文標題 : 自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡嗎?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號