點云目標(biāo)識別是實現(xiàn)三維環(huán)境智能感知與理解的重要技術(shù)之一,在自動駕駛、無人系統(tǒng)、空間探測等領(lǐng)域具有廣泛的應(yīng)用前景。然而,在實際場景下,受傳感器噪聲、環(huán)境干擾等因素影響,點云數(shù)據(jù)常存在擾動、缺失與形變等退化現(xiàn)象,顯著降低了傳統(tǒng)識別方法的準(zhǔn)確性與泛化能力。針對真實復(fù)雜環(huán)境下點云目標(biāo)智能識別中的關(guān)鍵科學(xué)問題和難題,許廷發(fā)、李佳男科研團隊開展了原創(chuàng)方法和關(guān)鍵技術(shù)攻關(guān),取得了突破性研究進展,相關(guān)論文陸續(xù)發(fā)表于IEEE TPAMI、NeurIPS (CCF-A)、ICCV (CCF-A)和ICLR等人工智能領(lǐng)域國際頂級期刊和會議,受到學(xué)術(shù)界的廣泛關(guān)注。
科研團隊主要從點云數(shù)據(jù)增強、特征學(xué)習(xí)與時序建模三個層面開展系統(tǒng)性研究,提出了樣本自適應(yīng)在線數(shù)據(jù)擴增方法、感知對抗模式捕獲策略,以及時序關(guān)聯(lián)高效建??蚣埽?/p>
1.樣本自適應(yīng)在線數(shù)據(jù)擴增方法(IEEE TPAMI 2025):該方法結(jié)合輸入點云的空間結(jié)構(gòu)特征與感知模型狀態(tài),自適應(yīng)對樣本施加多級形變與遮擋,生成貼近真實失真場景的點云數(shù)據(jù),拓展訓(xùn)練樣本的多樣性,從而顯著提升模型魯棒性(圖1)。
圖1. 樣本自適應(yīng)在線擴增方法示意圖。
2.基于對抗學(xué)習(xí)的點云模式捕獲策略(NeurIPS 2024):該策略在訓(xùn)練階段引入對抗性特征擦除機制,遮蔽模型已學(xué)習(xí)的目標(biāo)模式,迫使從目標(biāo)其他區(qū)域挖掘更具判別性的特征,進而強化對點云全局結(jié)構(gòu)的感知能力(圖2)。
圖2. 基于對抗學(xué)習(xí)的點云模式捕獲策略。
3.時序關(guān)聯(lián)高效建??蚣埽↖CLR 2025):該框架通過關(guān)聯(lián)機制將輸入點云幀與捕捉到的時序動態(tài)信息相融合,提取深度運動線索并對整個序列的時序特征進行統(tǒng)一建模,有效降低計算冗余,顯著提升了處理效率(圖3)。
圖3. 不同模型精度與速度的性能對比。
通過以上系列研究,總體構(gòu)建了面向復(fù)雜環(huán)境的點云目標(biāo)魯棒識別一體化技術(shù)架構(gòu),成功突破了點云數(shù)據(jù)高效擴增、精細化特征表達以及運動特征高效挖掘等關(guān)鍵技術(shù)瓶頸。提出的系列方法顯著提升了點云識別模型在失真條件下的魯棒性與泛化性能,并大幅提高了識別效率。
該系列研究成果提升了復(fù)雜環(huán)境下點云感知技術(shù)的可靠性與實用性,為無人系統(tǒng)自主導(dǎo)航、空間目標(biāo)感知等領(lǐng)域的實際應(yīng)用奠定了重要的理論支撐與技術(shù)保障。