CVPR 2020 |用于3D目標(biāo)檢測(cè)的層級(jí)圖網(wǎng)絡(luò)
論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds
由于大多數(shù)現(xiàn)有的點(diǎn)云對(duì)象檢測(cè)方法不能充分適應(yīng)點(diǎn)云的特征(例如稀疏性),所以一些關(guān)鍵的語(yǔ)義信息(如物體形狀)不能被很好的捕捉到。本文提出了一種基于層級(jí)圖網(wǎng)絡(luò)(HGNet)的圖卷積(GConv),可以直接將點(diǎn)云作為輸入來(lái)預(yù)測(cè) 3D 的邊界框。形狀注意圖卷積(SA-GConv)可以通過(guò)劍魔點(diǎn)的位置星系來(lái)描述物體形狀,基于 SA-GConv 的 U 形網(wǎng)絡(luò)可以通過(guò)改進(jìn)的 voting 模塊獲取多層級(jí)的特征進(jìn)而生成候選,然后一個(gè)基于圖卷積的候選推理模塊考慮全局的場(chǎng)景語(yǔ)義來(lái)對(duì)邊界框進(jìn)行預(yù)測(cè)。該框架在兩個(gè)大規(guī)模點(diǎn)云數(shù)據(jù)上的表現(xiàn)超過(guò)了目前最先進(jìn)的模型。
論文背景
由于點(diǎn)云的稀疏性,一些已有的為網(wǎng)格形式數(shù)據(jù)設(shè)計(jì)的方法(如CNN)在點(diǎn)云上的表現(xiàn)并不好,為解決這一問(wèn)題,最近有一些對(duì)點(diǎn)云數(shù)據(jù)的方法被提出,例如基于投影的方法、基于體卷積的方法和基于 PointNet 的方法。前兩種試圖將點(diǎn)云數(shù)據(jù)嚴(yán)格轉(zhuǎn)換為網(wǎng)格結(jié)構(gòu)數(shù)據(jù),而后一種則在不明確考慮點(diǎn)的幾何位置的情況下聚合特征。
與其他方法相比,PointNet++ 可以保留點(diǎn)的稀疏特點(diǎn),因此被廣泛作為框架的骨架。當(dāng)目前仍有一些未能很好解決的挑戰(zhàn),首先由于沒(méi)有考慮點(diǎn)的相對(duì)幾何位置,因此使用 PointNet++ 作為主干忽略了一些局部形狀信息。其次,框架的結(jié)構(gòu)沒(méi)有充分利用多級(jí)語(yǔ)義,這可能會(huì)忽略一些有助于目標(biāo)檢測(cè)的信息。
本文提出了一個(gè)基于圖卷積(GCONV)的層級(jí)圖網(wǎng)絡(luò)(HGNet)用于基于點(diǎn)云的 3D 目標(biāo)檢測(cè)。HGNet 包含三部分:一個(gè)基于圖卷積的 U 形網(wǎng)絡(luò)(GUnet)、一個(gè)候選生成器以及一個(gè)候選推理模塊(ProRe Module)。
整個(gè) HGNet 以端到端的方式進(jìn)行培訓(xùn)。在本文的框架中,點(diǎn)云的局部形狀信息、多級(jí)語(yǔ)義和全局場(chǎng)景信息(候選的特征)已被層級(jí)圖模型充分捕獲、聚合和合并,充分考慮了點(diǎn)云數(shù)據(jù)的特征。
本文的主要貢獻(xiàn)如下:
(A)開發(fā)了一種新的層級(jí)圖網(wǎng)絡(luò)(HGNet),用于在點(diǎn)云上進(jìn)行 3D 對(duì)象檢測(cè),其表現(xiàn)好于已有方法。
(B)提出了一種新穎的 SA-(De)GConv,它可以有效地聚合特征并捕獲點(diǎn)云中對(duì)象的形狀信息。
(C)構(gòu)建了一個(gè)新的 GU-net,用于生成多級(jí)特征,這對(duì)于 3D 對(duì)象檢測(cè)至關(guān)重要。
(D)利用全局信息,ProRe 模塊通過(guò)對(duì)候選進(jìn)行推理來(lái)提高效果。
論文模型
融合采樣
3D 目標(biāo)檢測(cè)有基于點(diǎn)和基于體素兩種框架,前者更加耗時(shí),由候選生成與預(yù)測(cè)細(xì)化兩個(gè)階段組成。
在第一個(gè)階段,SA 用于降采樣以獲得更高的效率以及擴(kuò)大感受野,F(xiàn)P 用來(lái)為降采樣過(guò)程中丟掉的點(diǎn)傳播特征。在第二階段,一個(gè)優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準(zhǔn)確的預(yù)測(cè)。SA 對(duì)于提取點(diǎn)的特征是必需的。但 FP 和優(yōu)化模塊會(huì)限制效率。
形狀注意圖卷積
點(diǎn)云通常不能清楚地表示出物體的形狀,可以使用其相鄰點(diǎn)的相對(duì)幾何位置來(lái)描述點(diǎn)周圍的局部形狀。本文介紹了一種新穎的形狀注意圖卷積,它通過(guò)對(duì)點(diǎn)的幾何位置建模來(lái)捕獲對(duì)象形狀。
對(duì)于一個(gè)點(diǎn)集 X,其中每一個(gè)點(diǎn)由其集合位置 p_i 以及 D 維的特征 f_i 組成,我們想要生成一個(gè) X’,本文設(shè)計(jì)了圖卷積用于聚合從 X 到 X’ 的特征。與 PointNet++的采樣層相類似,本文首先從 n 個(gè)點(diǎn)中采樣 n’ 個(gè)點(diǎn),通常 K 最近鄰(KNN)被用來(lái)在采樣中保留局部信息將其作為中心點(diǎn)特征。
其中 g 表示 i 和 j 的相對(duì)位置,通過(guò)一個(gè)卷積將三維變?yōu)橐痪S,f 是 mlp,然后二者的乘積就是中心點(diǎn)的 knn,其中最大的作為 i 的特征。形狀注意操作不同于簡(jiǎn)單的基于 mlp 的操作主要就是因?yàn)檫@個(gè) g 函數(shù)。雖然形式上沒(méi)有 attention 中的 softmax 這樣的歸一化,但是 g 的輸出就和 attention一樣,每個(gè)點(diǎn)的 weights,然后對(duì)應(yīng)的乘以特征。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 3 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 4 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 5 2025年8月人工智能投融資觀察
- 6 7 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 8 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車