近日,西安電子科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院多篇論文成果分別被國際頂級會議SIGMOD、VLDB、CVPR、ICLR、WWW、ICDE錄用。其中,智能媒體與數(shù)據(jù)工程研究所6篇論文分別被國際會議SIGMOD、VLDB、CVPR、ICLR、ICDE錄用,計算機網(wǎng)絡(luò)與物聯(lián)網(wǎng)工程研究所3篇論文被WWW、ICDE錄用,智能軟件與系統(tǒng)新技術(shù)研究所、軟件工程研究所、大數(shù)據(jù)與視覺智能研究所各有1篇論文被CVPR錄用,這些論文涵蓋向量數(shù)據(jù)庫、圖像壓縮、計算機視覺、大數(shù)據(jù)分析、網(wǎng)絡(luò)安全等多個領(lǐng)域。
智能媒體與數(shù)據(jù)工程研究所青年教師劉英帆論文“Fast Approximate Similarity Join in Vector Databases”被國際頂級會議SIGMOD 2025錄用,該論文第一作者是香港中文大學(xué)Jeffrey Xu Yu教授團隊博士生謝嘉東,通訊作者劉英帆。近似相似連接是向量數(shù)據(jù)庫系統(tǒng)中的一項核心操作,它連接兩個數(shù)據(jù)集并輸出兩個數(shù)據(jù)集中距離不超過指定值的所有向量對?,F(xiàn)有最先進的基于選擇的近似相似連接方法未充分利用連接操作本身的固有特性。該論文提出了一種名為SimJoin的新連接算法。該連接算法通過利用已處理數(shù)據(jù)點的連接窗口來加速連接窗口的處理,并且通過優(yōu)化連接窗口順序以最小化連接成本。此外,論文還討論了如何支持k-相似連接,以及如何基于k-相似連接維護鄰域圖索引。根據(jù)實驗結(jié)果,論文所提出的算法顯著優(yōu)于現(xiàn)有的最先進方法。
智能媒體與數(shù)據(jù)工程研究所高熙越副教授,通訊作者李輝教授論文“Fucci: Database Transaction Fuzzing via Random Conflict Construction and Multilevel Constraint Solving”被國際頂級會議VLDB 2025錄用。該論文提出了一種新穎的數(shù)據(jù)庫事務(wù)模糊測試框架Fucci,旨在提升數(shù)據(jù)庫事務(wù)漏洞檢測的效率與準確性。Fucci采用隨機沖突構(gòu)造(RCC)技術(shù),在事務(wù)測試用例生成過程中主動引入讀寫沖突或?qū)憣憶_突,以增強測試用例的有效性;再結(jié)合多級約束求解(MCS)技術(shù),通過外部多版本控制系統(tǒng)精確模擬數(shù)據(jù)可見性,提高求解過程的效率和準確性;最后利用經(jīng)驗驅(qū)動自動簡化(EAS)技術(shù),對檢測到的漏洞案例進行深度簡化,大幅提升漏洞報告的可讀性和分析效率。
智能媒體與數(shù)據(jù)工程研究所碩士生楊碩,通訊作者青年教師劉英帆論文“Revisiting the Index Construction of Proximity Graph-Based Approximate Nearest Neighbor Search”被國際頂級會議2025VLDB錄用,該論文共同第一作者是香港中文大學(xué)Jeffrey Xu Yu教授團隊博士生謝嘉東。作為高維數(shù)據(jù)上k最近鄰查詢SOTA的方法,鄰域圖越來越受歡迎。但其構(gòu)建成本非常大,與向量數(shù)量呈超線性關(guān)系,從而限制了其在大數(shù)據(jù)時代的可擴展性。論文回顧了兩種主流的鄰域圖,即Relative Neighborhood Graph(RNG)和Navigable Small Word Graph(NSWG)的構(gòu)建過程,發(fā)現(xiàn)了影響其構(gòu)建效率的問題。針對這些問題,論文提出了一種新的面向RNG圖索引的構(gòu)建框架,并且將該框架集成到NSWG索引構(gòu)建過程。根據(jù)實驗結(jié)果,論文所提出的方法可以顯著加速鄰域圖索引構(gòu)建過程,并保證查詢性能不損失。
智能媒體與數(shù)據(jù)工程研究所博士生趙凱博,通訊作者喬曉田副教授論文“Less is More: Efficient Image Vectorization with Adaptive Parameterization”被國際頂級會議CVPR 2025錄用。該論文提出了一種參數(shù)自適應(yīng)的高效圖像矢量化方法,針對不同形狀復(fù)雜度的圖層設(shè)計了一種新穎的分配機制來自適應(yīng)調(diào)整控制點分布,并通過可微分渲染對圖層形狀和色彩參數(shù)進行迭代優(yōu)化。實驗證明,論文所提方法在計算效率、矢量化精度和可編輯性方面均優(yōu)于現(xiàn)有的圖像矢量化方法。
智能媒體與數(shù)據(jù)工程研究所閆杰熹副教授論文“Towards Unified Human Motion-Language Understanding via Sparse Interpretable Characterization”被國際頂級會議ICLR 2025錄用,該論文第一作者是鄧成教授團隊博士生呂光濤,通訊作者閆杰熹副教授。該論文提出了一種全新的動作-語言表征范式與多階段訓(xùn)練策略,通過構(gòu)建稀疏、語義精確且高度可解釋的詞匯表征,顯著提升對人類動作的直觀理解與跨模態(tài)語義對齊能力。在多個公共數(shù)據(jù)集上的綜合分析和大量實驗表明,所提出的模型在各種任務(wù)和場景中都實現(xiàn)了最先進的性能。
智能媒體與數(shù)據(jù)工程研究所李雁妮教授論文“A Novel Key Point Based MLCS Algorithm for Big Sequences Mining”被高水平期刊IEEE TKDE錄用,同時該論文擴展摘要被頂會ICDE 2025錄用。所謂MLCS問題,即從3個或更多的字符串中尋找其最長的公共子序列(Multiple Longest Common Subsequence,MLCS),它在生物信息學(xué)、數(shù)據(jù)挖掘、信息抽取等領(lǐng)域具有重要的應(yīng)用,是四十年來未解的NP難問題。已有的算法不能對較長的序列(序列長度大于1000)和大序列(長度大于10000)進行MLCS的精確求解。針對現(xiàn)有算法問題,論文首次提出了一種新的基于關(guān)鍵點的問題求解圖模型,在此基礎(chǔ)上,提出了一種新的基于關(guān)鍵點的MLCS并行算法,突破了已有的MLCS算法瓶頸問題,算法性能大大優(yōu)于現(xiàn)有的MLCS算法,而且可以實現(xiàn)大序列的MLCS精確求解。
計算機網(wǎng)絡(luò)與物聯(lián)網(wǎng)工程研究所博士生桑安源,通訊作者楊力教授論文“STGAN: Detecting Host Threats via Fusion of Spatial-Temporal Features in Host Provenance Graphs”被國際頂級會議WWW 2025錄用。該論文提出了STGAN,面向高級持續(xù)性威脅(APT)和勒索軟件等復(fù)雜網(wǎng)絡(luò)攻擊場景,將時空圖融入主機溯源圖建模,通過時空編碼提取動態(tài)溯源圖中的時間、空間和語義特征,并利用多頭自注意力機制進行異常檢測。在DARPA TC數(shù)據(jù)上的實驗結(jié)果表明,與現(xiàn)有技術(shù)相比,STGAN在檢測性能上顯著提升,同時擁有較高的系統(tǒng)可伸縮性,展現(xiàn)其在主機威脅檢測領(lǐng)域的潛力和應(yīng)用前景。
計算機網(wǎng)絡(luò)與物聯(lián)網(wǎng)工程研究所周成博士生,通訊作者李光夏副教授論文“Training-free Graph Anomaly Detection: A Simple Approach via Singular Value Decomposition”被國際頂級會議WWW 2025錄用。論文針對現(xiàn)有基于深度學(xué)習(xí)的圖異常檢測方法精度低、訓(xùn)練時間長、可擴展性差的問題,提出了一種無訓(xùn)練的圖異常檢測方法(TFGAD)。其使用不同的矩陣分別處理節(jié)點屬性和局部結(jié)構(gòu),通過奇異值分解得到最優(yōu)解,從而消除了額外訓(xùn)練的開銷。對于異常檢測任務(wù),論文提出了一種輕量級的評分函數(shù),該函數(shù)將節(jié)點屬性的重建誤差與局部結(jié)構(gòu)的投影長度相結(jié)合,以量化節(jié)點異常。實驗表明TFGAD顯著優(yōu)于最先進的基于深度學(xué)習(xí)的圖異常檢測方法,同時減少了運行時內(nèi)存開銷,特別適用于計算資源受限場景中的圖異常檢測任務(wù)。
計算機網(wǎng)絡(luò)與物聯(lián)網(wǎng)工程研究所盧笛教授論文“BiTDB: Constructing A Built-in TEE Secure Database for Embedded Systems”擴展摘要被國際頂級會議ICDE 2025錄用,該論文發(fā)表于高水平期刊IEEE TKDE,論文第一作者為馬建峰教授團隊馬承彥博士,通訊作者盧笛教授。論文明確了基于密文計算的加密數(shù)據(jù)庫存在的功能和性能局限性,提出了內(nèi)建于TEE的數(shù)據(jù)庫系統(tǒng)架構(gòu)。通過可信環(huán)境下的明文計算,實現(xiàn)了對數(shù)據(jù)庫功能的100%覆蓋,解決了傳統(tǒng)依賴可搜索加密算法的數(shù)據(jù)庫系統(tǒng)功能覆蓋度不足、數(shù)據(jù)操作性能受限的問題。通過三項優(yōu)化措施,減少了文件訪問、內(nèi)存操作以及世界切換帶來的額外時間和性能開銷。實現(xiàn)了原型系統(tǒng),TPC-H實驗表明,BiTDB在保證數(shù)據(jù)計算和存儲機密性、完整性的同時,達到原始數(shù)據(jù)庫85%的性能。
智能軟件與系統(tǒng)新技術(shù)研究所宋娟副教授論文“Taming Large Multimodal Agents for Ultra-low Bitrate Semantically Disentangled Image Compression”被國際頂級會議CVPR 2025錄用,該論文通訊作者馮明濤副教授。針對超低碼率圖像壓縮,該論文提出新穎的圖像壓縮框架—語義解耦圖像壓縮(SEDIC)。所提出的SEDIC利用大規(guī)模多模態(tài)模型將圖像解耦為多個重要的語義信息,包括極限壓縮的參考圖像、整體和物體級文本描述以及語義掩碼。論文設(shè)計了一個多階段語義解碼器,逐個物體地恢復(fù)傳輸?shù)膮⒖紙D像,最終生成高質(zhì)量且感知一致的重建圖像。實驗結(jié)果表明,SEDIC顯著優(yōu)于現(xiàn)有的最先進方法,在超低比特率下實現(xiàn)了更優(yōu)的感知質(zhì)量和語義一致性。
軟件工程研究所方厚章副教授論文“Detection-Friendly Nonuniformity Correction: A Union Framework for Infrared UAV Target Detection”被國際頂級會議CVPR 2025錄用。該論文首次提出了一種統(tǒng)一的端到端框架(UniCD),同時解決紅外圖像的非均勻性校正(NUC)和目標檢測問題。論文首次將NUC建模為模型與數(shù)據(jù)聯(lián)合驅(qū)動的少量超參數(shù)估計問題,同時引入新的輔助損失來增強目標特征并抑制背景。論文引入了檢測引導(dǎo)的自監(jiān)督損失,減少任務(wù)間特征差異,提升檢測魯棒性。論文首次構(gòu)建了一個基準數(shù)據(jù)集IRBFD,包含50,000張具有不同非均勻性程度和多尺度目標的紅外圖像。實驗結(jié)果表明,UniCD在IRBFD數(shù)據(jù)集上表現(xiàn)優(yōu)異,并可實時處理。
大數(shù)據(jù)與視覺智能研究所博士生劉糠,通訊作者青年教師馬卓奇論文“Enhanced Contrastive Learning with Multi-view Longitudinal Data for Chest X-ray Report Generation”被國際頂級會議CVPR 2025錄用。該論文提出了基于多視角縱向數(shù)據(jù)的增強對比學(xué)習(xí)方法(MLRG),用于胸部X光片報告的自動生成。通過引入多視角影像的空間信息和縱向數(shù)據(jù)的時序信息,指導(dǎo)模型生成更為準確的臨床報告。實驗表明,MLRG在多個公開數(shù)據(jù)集上顯著優(yōu)于現(xiàn)有方法。
這些成果充分展示了學(xué)校在計算機學(xué)科相關(guān)研究方向取得的重要學(xué)術(shù)進展,標志著學(xué)校在該領(lǐng)域的研究得到了國際同行的進一步認可,推動學(xué)科建設(shè)創(chuàng)新發(fā)展。