123,123

自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡嗎？

2026-04-20 11:11

在自動駕駛的視覺感知領域，占用網(wǎng)絡（Occupancy Network）風頭正勁，大有取代傳統(tǒng)目標檢測方案的勢頭。在最近一篇交流占用網(wǎng)絡的文章中，有小伙伴提問，自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡（CNN）嗎？

對于這個問題我們需要先厘清它們在整個系統(tǒng)里扮演的角色。占用網(wǎng)絡在自動駕駛中更像是一種對世界的表達方式，而CNN則是處理圖像信息的基礎工具。這兩者之間并不是非此即彼的替代關系，而是各司其職。

傳統(tǒng)的視覺識別是怎么工作的？

在占用網(wǎng)絡流行之前，自動駕駛的主流感知方案是基于CNN的目標檢測。你可以把它想象成給攝像頭拍到的每一張照片畫框。

當攝像頭拍攝到前方的道路，CNN會通過一層層的卷積運算，從像素中提取出邊緣、紋理、形狀等特征。如果它發(fā)現(xiàn)某個區(qū)域的特征符合它學習過的車或者人的特征，就會在該位置打上一個標簽，并給出一個矩形框。

卷積神經網(wǎng)絡架構

這種方式在處理標準物體時效率非常高，因為它直接告訴了系統(tǒng)前方多遠有一輛車。

然而，單純依靠畫框的方案存在一個明顯的短板，就是它很難處理那些沒見過的物體。

如果路面上掉落了一個形狀奇特的塑料桶，或者有一輛側翻的運載奇形怪狀建筑材料的卡車，傳統(tǒng)的CNN目標檢測模型可能會因為找不到匹配的特征而漏檢。

這是因為這類模型本質上是在做分類題，如果題目超出了它的知識庫，它就可能選擇視而不見。這種漏檢對于追求極致安全的自動駕駛來說，顯然是不可接受的。

為什么需要占用網(wǎng)絡？

為了解決這種“長尾問題”，占用網(wǎng)絡應運而生。它不再試圖去分辨前方到底是車還是樹，而是直接把三維空間切成無數(shù)個微小的方格，也就是我們常說的體素。

占用網(wǎng)絡的目標非常單純，那就是判斷每一個方格是被占據(jù)了，還是空閑的。

通過這種方式，感知系統(tǒng)就能構建出一個實時的三維物理世界模型。在這個模型里，哪怕前方是一堆亂七八糟的雜物，只要它占據(jù)了空間，占用網(wǎng)絡就會把它標記為不可通行。

這種從做分類題到做空間判斷題的轉變，極大地提升了自動駕駛對未知環(huán)境的適應能力。它不再依賴于復雜的物體標簽，而是回歸到了物理世界的本質。

通過占用網(wǎng)絡，車輛可以更精準地感知物體的邊緣、高度和深度，甚至能預測物體在空間中的運動趨勢。

這不僅解決了漏檢奇形怪狀物體的問題，也為車輛的規(guī)控系統(tǒng)提供了更干凈、更立體的環(huán)境地圖。

占用網(wǎng)絡和CNN是替代關系嗎？

既然占用網(wǎng)絡這么厲害，那CNN是不是就可以不再使用了呢？答案是否定的。實際上，目前的占用網(wǎng)絡架構中，CNN依然發(fā)揮著不可替代的基礎作用。

我們要明白，占用網(wǎng)絡處理的是三維空間的占用情況，但傳感器的輸入，尤其是攝像頭拍攝的原始畫面，依然是二維的像素點。

要把這些雜亂的像素變成有意義的特征，最成熟、最高效的手段依然是CNN。

在目前的感知流程中，CNN充當著骨干網(wǎng)絡的角色。攝像頭捕獲圖像后，首先由CNN進行初步的特征提取，把圖像轉化成高維的特征向量。這些特征向量里包含了物體的顏色、紋理、明暗變化等關鍵信息。

隨后，這些信息才會被送入后續(xù)的模塊（比如Transformer或跨空間映射模塊），轉化成三維空間下的占用概率。

換句話說，CNN負責看，它提供了感知的素材；而占用網(wǎng)絡負責想，它基于這些素材把世界構造成三維的模樣。

未來的感知架構會如何演進？

雖然CNN目前依然穩(wěn)坐骨干網(wǎng)絡的寶座，但自動駕駛的感知架構確實在發(fā)生變化。隨著計算硬件的升級，一些原本由CNN承擔的任務正在向Transformer轉移，尤其是在處理多攝像頭融合和長時序信息時，Transformer表現(xiàn)出了更強的全局建模能力。

但這并不意味著CNN會徹底消失。在一些對實時性要求極高、計算資源相對有限的邊緣處理任務上，CNN憑借其局部特征提取的極高效率，依然具有很強的競爭力。

未來的自動駕駛感知系統(tǒng)，大概率會是一種多種技術深度融合的狀態(tài)。CNN可能會繼續(xù)在底層處理圖像像素，通過輕量化的設計快速提取基礎特征；而占用網(wǎng)絡則在更高層級上統(tǒng)領全局，把來自不同傳感器的數(shù)據(jù)整合成統(tǒng)一的空間模型。

在這個進化的過程中，占用網(wǎng)絡并沒有淘汰CNN，而是把CNN從繁重的畫框任務中解放了出來，讓它回歸到最擅長的圖像特征提取工作中。

兩者的結合，讓自動駕駛汽車能夠不僅看清路上的物體，更能真正讀懂這個立體的物理世界。

-- END --

原文標題 : 自動駕駛有了占用網(wǎng)絡還需要卷積神經網(wǎng)絡嗎？

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯(lián)系舉報。

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞