愛芯元智亮相2025玄鐵RISC-V生態(tài)大會：以高能效NPU驅動邊緣智能革新

作者：愛集微 03-04 10:40

來源：愛芯元智 #愛芯元智#

1.3w

近日，2025玄鐵RISC-V生態(tài)大會在京召開，全球數(shù)百家企業(yè)及機構齊聚，探討RISC-V與AI融合的技術路徑與生態(tài)前景。

在DeepSeek等大模型推動AI向端側滲透的浪潮下，邊緣算力需求激增，AI芯片行業(yè)正經歷從“云優(yōu)先”到“云邊協(xié)同”的范式轉變。作為“玄鐵優(yōu)選伙伴”，愛芯元智攜自研愛芯通元混合精度NPU亮相，展示其如何以開放生態(tài)與專用架構，助力大模型在邊端側高效落地。

大模型“輕量化”浪潮加速邊緣智能

DeepSeek-R1熱潮所帶來的大模型訓練與推理成本降低，推動AI應用加速從云端下沉至邊緣設備。IDC數(shù)據(jù)顯示，未來幾年邊緣側數(shù)據(jù)量將占總數(shù)據(jù)量的50%，這些數(shù)據(jù)需依賴端側AI芯片進行實時處理，進一步推動邊緣AI芯片市場擴張。

然而，邊緣場景的碎片化與嚴苛的功耗限制，也對傳統(tǒng)算力架構提出了挑戰(zhàn)。GPU雖在并行計算上具備優(yōu)勢，但其高功耗與固定架構難以適配多樣化的端側需求；而通用CPU的靈活性雖高，卻受限于算力密度。在此背景下，通過RISC-V處理器的高效調度與NPU的專用加速，實現(xiàn)算力與能效的平衡已成為共識。

為邊緣智能而來愛芯通元NPU原生支持主流大模型

作為“玄鐵優(yōu)選伙伴”，愛芯元智現(xiàn)場展示的愛芯通元混合精度NPU，就是針對邊緣場景設計的專用AI處理器。其以算子為原子指令集，原生支持DeepSeek、Llama、Qwen等主流大模型結構，通過多線程異構多核設計與混合精度優(yōu)化，在保證高算力密度的同時顯著降低功耗。以典型視覺任務SwinT為例，該NPU可實現(xiàn)199 FPS/W的超低能耗，能效遠超傳統(tǒng)方案。

此外，NPU的靈活擴展能力支持算力從4T至256T動態(tài)適配，覆蓋從智能攝像頭到車載計算平臺的多樣化需求。在智慧城市領域，其硬件壓縮單元與算法優(yōu)化技術可明顯減少帶寬占用；在智能駕駛場景中，內置的Transformer加速模塊可大幅降低BEV（鳥瞰圖）模型推理延遲。這些特性使其成為邊緣大模型落地的關鍵技術支撐。

RISC-V與NPU的“雙輪驅動”

RISC-V的開放性為AI芯片定制化提供了底層支持。據(jù)RISC-V國際基金會數(shù)據(jù)，2024年全球RISC-V芯片出貨量已超100億顆，其中30%應用于AI加速場景。愛芯元智深度融入玄鐵生態(tài)，將自研愛芯通元NPU與玄鐵RISC-V處理器結合，提供從感知、計算到數(shù)據(jù)處理的端到端解決方案。

此次大會上，基于玄鐵C920處理器的AI PC原型機成功運行Llama、DeepSeek等模型，驗證了“RISC-V+NPU”異構架構在端側大模型部署中的可行性。而愛芯通元NPU單位能耗性能領先行業(yè)平均水平，為邊緣設備運行復雜AI模型樹立了新標桿。

當前，AI芯片行業(yè)競爭已從單純算力比拼轉向場景化適配能力。愛芯元智以“普惠AI造就美好生活”為使命，通過愛芯通元NPU與玄鐵RISC-V的深度協(xié)同，成為驅動行業(yè)從“云端集中”邁向“邊緣智能”的關鍵力量。

AI技術和應用的持續(xù)革新，帶來邊緣AI的算力爆發(fā)。愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉表示，愛芯通元NPU與玄鐵RISC-V IP的結合，打造出高能效AI計算平臺，滿足邊端不同場景下對感知、計算和數(shù)據(jù)處理能力的需求。未來，雙方將繼續(xù)強強聯(lián)合，探索AI算力提升及行業(yè)落地，我們相信，高效AI推理芯片的應用也將迎來更廣闊的天地。