數(shù)字信號處理技術(shù)無處不在。如今的設(shè)備常常配備數(shù)十個傳感器,這些傳感器采集的數(shù)據(jù)要經(jīng)過篩選與聚合處理后,才能為人工智能(AI)模型所用。隨著人工智能工作負(fù)載在各行各業(yè)中日益普及,嵌入式系統(tǒng)對強(qiáng)大且高效的信號處理能力的需求也與日俱增。這些計算密集型人工智能算法通??刂拼a量有限,主要在數(shù)據(jù)流上運行,并且要求具備硬實時性能,同時滿足低延遲的嚴(yán)格限制。
因此,數(shù)字信號處理器(DSP)成為了解決方案中不可或缺的關(guān)鍵部分。與通用處理器不同,DSP能夠并行執(zhí)行矢量化計算,從而最大限度地減少計算周期數(shù)和延遲。然而,增加矢量大小會占用更多的芯片面積,因此需要在性能與效率之間找到恰當(dāng)?shù)钠胶狻?/p>
這正是行業(yè)需要更多選擇的原因所在。開發(fā)者在挑選DSP時,不僅要確保其能滿足特定應(yīng)用的性能要求,還要使其符合給定的芯片面積和功耗預(yù)算限制。幸運的是,新思科技的ARC VPX產(chǎn)品系列最近進(jìn)行了擴(kuò)展,正好滿足了這一需求。
新型ARC VPX6處理器為該產(chǎn)品系列引入了1024位矢量處理功能,進(jìn)一步豐富了現(xiàn)有的VPX系列,該系列還包括VPX5(512位)、VPX3(256位)和VPX2(128位)等不同版本。VPX6在將峰值性能提升至原來兩倍的同時,還能與VPX系列的其他成員保持完全的軟件兼容性。開發(fā)者只需對硬件進(jìn)行升級,而無需重新編寫代碼,就能從一開始便實現(xiàn)性能的顯著提升。
ARC VPX DSP系列
ARC VPX DSP系列是專為低功耗、高吞吐量計算而設(shè)計的高性能矢量DSP。這些處理器廣泛應(yīng)用于汽車傳感、人工智能視覺系統(tǒng)、雷達(dá)/激光雷達(dá)和工業(yè)自動化領(lǐng)域,在這些領(lǐng)域,對海量數(shù)據(jù)流進(jìn)行實時處理至關(guān)重要。
早期的VPX處理器支持128位、256位和512位的矢量長度,這使得開發(fā)者能夠根據(jù)工作負(fù)載選擇最高效的處理配置。這些處理器具有魯棒的多核可擴(kuò)展性,但隨著更高分辨率攝像頭、更密集傳感器陣列以及更復(fù)雜人工智能模型的出現(xiàn)導(dǎo)致數(shù)據(jù)量持續(xù)增長,許多應(yīng)用對并行處理效率提出了更高的要求。
新型ARC VPX6通過引入1024位矢量處理功能,進(jìn)一步擴(kuò)充了VPX系列,其數(shù)據(jù)吞吐量相較于VPX5提升了一倍。VPX6在與之前VPX處理器保持向后兼容性的基礎(chǔ)上,提供了一種可擴(kuò)展的高效解決方案,以滿足新一代人工智能和嵌入式系統(tǒng)的需求。
VPX6的突出優(yōu)勢
ARC VPX6的核心改進(jìn)在于其引入了1024位矢量單指令多數(shù)據(jù)(SIMD)處理技術(shù),該技術(shù)顯著提高了計算效率。借助SIMD架構(gòu),VPX6能夠同時對多個數(shù)據(jù)點執(zhí)行單一操作,從而減少了所需的計算周期。與VPX5的512位處理能力(每周期可執(zhí)行64次單精度浮點運算)相比,VPX6的運算能力達(dá)到了其兩倍,每周期可執(zhí)行128次運算。這使得VPX6在圖像濾波、雷達(dá)批量快速傅里葉變換(FFT)、人工智能預(yù)處理以及傳感器融合等工作負(fù)載中表現(xiàn)出色,性能得到了顯著增強(qiáng)。
除了強(qiáng)大的原始計算能力外,ARC VPX6還配備了先進(jìn)的直接內(nèi)存訪問(DMA)引擎,該引擎能夠確保數(shù)據(jù)持續(xù)不斷地流向處理器,避免出現(xiàn)空閑周期,從而最大限度地提高數(shù)據(jù)吞吐量。VPX6支持雙緩沖技術(shù),能夠有效地隱藏內(nèi)存延遲,從而最大限度地提高了計算效率。
值得注意的是,矢量處理受阿姆達(dá)爾定律的約束。那么,并行化的程度能夠達(dá)到多高,以及在哪個階段將任務(wù)分配給多個并行工作的內(nèi)核更為合適呢?這些問題的答案取決于具體的應(yīng)用工作負(fù)載。而VPX6的出現(xiàn)為開發(fā)者提供了更多的選擇。
▲ 新思科技 ARC VPX 數(shù)字信號處理器 IP
可擴(kuò)展性、可配置性與易用性
ARC VPX6完全向后兼容VPX2、VPX3和VPX5,能輕松集成到新設(shè)計或現(xiàn)有設(shè)計中。例如,新思科技提供了與矢量長度無關(guān)的庫,確保之前為VPX處理器編寫的遺留軟件無需修改,就能在VPX6上運行。這種兼容性縮短了開發(fā)周期,開發(fā)者不用修改現(xiàn)有代碼庫,就能輕松升級解決方案。與矢量長度無關(guān)的設(shè)計方法,使得基于相同的軟件基礎(chǔ)架構(gòu),能夠開發(fā)出滿足不同性能需求(從低端到高端)的完整產(chǎn)品系列。
與VPX系列的其他成員一樣,VPX6具有高度可配置性。例如,開發(fā)者可以輕松定義寄存器數(shù)量、L1和L2內(nèi)存大小等參數(shù),或者決定是否在架構(gòu)中集成數(shù)學(xué)和FFT加速器。這種靈活性使工程師能夠根據(jù)具體的應(yīng)用需求定制架構(gòu),有效地避免了芯片面積和功耗的不必要開銷。
為了進(jìn)一步提高可擴(kuò)展性,VPX6提供了多種配置選項:單核(VPX6)、雙核(VPX6x2)和四核(VPX6x4)。這些完全集成的多核解決方案配備了共享的DMA引擎、內(nèi)存一致性機(jī)制、同步支持以及運行時庫。這使得開發(fā)者能夠根據(jù)特定的工作負(fù)載需求,對性能和能效進(jìn)行優(yōu)化。
VPX系列的所有成員均采用ARC處理器擴(kuò)展(APEX)專利技術(shù),允許開發(fā)者創(chuàng)建用戶自定義的標(biāo)量和矢量指令。同時,它還支持集成定制的硬件加速器,在提升特定應(yīng)用性能的同時,降低了功耗和內(nèi)存需求。VPX處理器還有豐富的預(yù)優(yōu)化庫,涵蓋DSP、線性代數(shù)和視覺處理領(lǐng)域,其中包括專為OpenCV風(fēng)格操作定制的視覺內(nèi)核。這些庫提供了現(xiàn)成的軟件功能,如顏色轉(zhuǎn)換、解算器、邊緣檢測、物體跟蹤、矩陣變換和FFT等。
為VPX6設(shè)計的新功能,包括能夠處理長內(nèi)存延遲的增強(qiáng)型DMA,以及對人工智能應(yīng)用緊湊型數(shù)據(jù)存儲新行業(yè)標(biāo)準(zhǔn)OCP-MX的支持,也將推廣到整個VPX系列。
VPX6具有重大影響力的應(yīng)用領(lǐng)域
ARC VPX6為開發(fā)者帶來了諸多優(yōu)勢,非常適合用于眾多實時、高性能信號處理應(yīng)用:
汽車傳感器處理:VPX6為高級駕駛輔助系統(tǒng)(ADAS)提供了有力支持。其高吞吐量的矢量化計算和優(yōu)化的SIMD處理功能,能夠高效地處理來自多個傳感器的攝像頭數(shù)據(jù),實時識別物體、車道標(biāo)線和行人。同樣,在自動駕駛汽車的雷達(dá)和激光雷達(dá)數(shù)據(jù)處理方面,VPX6能夠加速物體檢測和距離估算,從而提升基于人工智能的決策能力。
工業(yè)和智能攝像頭:VPX6能夠?qū)崿F(xiàn)高速圖像濾波、降噪和特征增強(qiáng)。這些功能為先進(jìn)的視覺處理提供了有力支持,減少甚至消除了對專用外部處理器的依賴。
人工智能和機(jī)器學(xué)習(xí)工作負(fù)載:VPX6可作為高速預(yù)處理器,在將數(shù)據(jù)傳遞給神經(jīng)處理單元(NPU)(如新思科技ARC NPX)之前對數(shù)據(jù)進(jìn)行優(yōu)化處理。通過處理計算密集型濾波和特征提取任務(wù),VPX6能夠顯著提高推理效率,減少人工智能工作負(fù)載中的瓶頸問題。借助集成SDK(內(nèi)含基于ONNX的神經(jīng)網(wǎng)絡(luò)編譯器),人工智能任務(wù)能在VPX和NPX之間自動分配。由VPX和NPX組成的人工智能子系統(tǒng),結(jié)合了人工智能加速器的強(qiáng)勁性能以及強(qiáng)大DSP的前瞻性和靈活性。
安全實現(xiàn):上述許多應(yīng)用都對信息安全和軟件安全有著嚴(yán)格的認(rèn)證要求。因此,VPX系列的所有成員都提供了功能安全(FS)版本,該版本不僅通過了ISO 26262 ASIL信息安全認(rèn)證,還符合ISO/SAE 21434網(wǎng)絡(luò)安全標(biāo)準(zhǔn)。經(jīng)過安全認(rèn)證的硬件,搭配經(jīng)過安全認(rèn)證的編譯器、運行時環(huán)境和計算庫,確保了系統(tǒng)安全穩(wěn)定。
將數(shù)字信號處理提升到新高度
新思科技的ARC VPX6將數(shù)字信號處理技術(shù)提升至全新的水平。它在將VPX5的性能提升一倍的同時,減少了計算周期和功耗并且保持了軟件的完全兼容性,便于開發(fā)者采用。VPX6具有更高的可擴(kuò)展性和效率,為開發(fā)者提供了更大的靈活性,使他們能夠根據(jù)特定的工作負(fù)載優(yōu)化功耗、性能和面積(PPA)。
展望未來,新思科技將繼續(xù)推進(jìn)ARC VPX處理器系列的發(fā)展,以滿足人工智能和嵌入式系統(tǒng)不斷變化的需求。通過提供行業(yè)領(lǐng)先的工具、優(yōu)化的庫以及便捷的集成選項,新思科技將助力開發(fā)者突破高性能信號處理的界限,實現(xiàn)更多的創(chuàng)新。