近日,2025玄鐵RISC-V生態(tài)大會在京召開,全球數(shù)百家企業(yè)及機構齊聚,探討RISC-V與AI融合的技術路徑與生態(tài)前景。
在DeepSeek等大模型推動AI向端側滲透的浪潮下,邊緣算力需求激增,AI芯片行業(yè)正經歷從“云優(yōu)先”到“云邊協(xié)同”的范式轉變。作為“玄鐵優(yōu)選伙伴”,愛芯元智攜自研愛芯通元混合精度NPU亮相,展示其如何以開放生態(tài)與專用架構,助力大模型在邊端側高效落地。
大模型“輕量化”浪潮加速邊緣智能
DeepSeek-R1熱潮所帶來的大模型訓練與推理成本降低,推動AI應用加速從云端下沉至邊緣設備。IDC數(shù)據(jù)顯示,未來幾年邊緣側數(shù)據(jù)量將占總數(shù)據(jù)量的50%,這些數(shù)據(jù)需依賴端側AI芯片進行實時處理,進一步推動邊緣AI芯片市場擴張。
然而,邊緣場景的碎片化與嚴苛的功耗限制,也對傳統(tǒng)算力架構提出了挑戰(zhàn)。GPU雖在并行計算上具備優(yōu)勢,但其高功耗與固定架構難以適配多樣化的端側需求;而通用CPU的靈活性雖高,卻受限于算力密度。在此背景下,通過RISC-V處理器的高效調度與NPU的專用加速,實現(xiàn)算力與能效的平衡已成為共識。
為邊緣智能而來 愛芯通元NPU原生支持主流大模型
作為“玄鐵優(yōu)選伙伴”,愛芯元智現(xiàn)場展示的愛芯通元混合精度NPU,就是針對邊緣場景設計的專用AI處理器。其以算子為原子指令集,原生支持DeepSeek、Llama、Qwen等主流大模型結構,通過多線程異構多核設計與混合精度優(yōu)化,在保證高算力密度的同時顯著降低功耗。以典型視覺任務SwinT為例,該NPU可實現(xiàn)199 FPS/W的超低能耗,能效遠超傳統(tǒng)方案。
此外,NPU的靈活擴展能力支持算力從4T至256T動態(tài)適配,覆蓋從智能攝像頭到車載計算平臺的多樣化需求。在智慧城市領域,其硬件壓縮單元與算法優(yōu)化技術可明顯減少帶寬占用;在智能駕駛場景中,內置的Transformer加速模塊可大幅降低BEV(鳥瞰圖)模型推理延遲。這些特性使其成為邊緣大模型落地的關鍵技術支撐。
RISC-V與NPU的“雙輪驅動”
RISC-V的開放性為AI芯片定制化提供了底層支持。據(jù)RISC-V國際基金會數(shù)據(jù),2024年全球RISC-V芯片出貨量已超100億顆,其中30%應用于AI加速場景。愛芯元智深度融入玄鐵生態(tài),將自研愛芯通元NPU與玄鐵RISC-V處理器結合,提供從感知、計算到數(shù)據(jù)處理的端到端解決方案。
此次大會上,基于玄鐵C920處理器的AI PC原型機成功運行Llama、DeepSeek等模型,驗證了“RISC-V+NPU”異構架構在端側大模型部署中的可行性。而愛芯通元NPU單位能耗性能領先行業(yè)平均水平,為邊緣設備運行復雜AI模型樹立了新標桿。
當前,AI芯片行業(yè)競爭已從單純算力比拼轉向場景化適配能力。愛芯元智以“普惠AI造就美好生活”為使命,通過愛芯通元NPU與玄鐵RISC-V的深度協(xié)同,成為驅動行業(yè)從“云端集中”邁向“邊緣智能”的關鍵力量。
AI技術和應用的持續(xù)革新,帶來邊緣AI的算力爆發(fā)。愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉表示,愛芯通元NPU與玄鐵RISC-V IP的結合,打造出高能效AI計算平臺,滿足邊端不同場景下對感知、計算和數(shù)據(jù)處理能力的需求。未來,雙方將繼續(xù)強強聯(lián)合,探索AI算力提升及行業(yè)落地,我們相信,高效AI推理芯片的應用也將迎來更廣闊的天地。