今年以來,DeepSeek、Qwen3等明星大模型不斷涌現(xiàn)并迅速普及,AI已成為眾多企業(yè)發(fā)掘業(yè)務增量的關(guān)鍵考量。近期Arm《人工智能就緒指數(shù)報告》分享了一組數(shù)據(jù):逾8成受訪企業(yè)表示正積極采用AI技術(shù),但僅有29%的企業(yè)能夠自動擴展計算資源,近半數(shù)的企業(yè)領(lǐng)導者擔心因模型提取而造成的數(shù)據(jù)隱私泄露。顯然,AI技術(shù)的真正商業(yè)化落地,仍需企業(yè)在基礎(chǔ)設(shè)施、系統(tǒng)安全等方面做足準備。
與此同時,隨著“摩爾定律”不斷逼近物理極限,依托于制造工藝演進的傳統(tǒng)芯片產(chǎn)業(yè)邏輯亟待重塑,加之AI計算工作負載的規(guī)模與復雜性持續(xù)攀升,芯片設(shè)計廠商需要在核心技術(shù)革新的基礎(chǔ)上,進一步加強能效優(yōu)化、安全架構(gòu)、軟硬件協(xié)同、標準化生態(tài)構(gòu)建等系統(tǒng)級創(chuàng)新,以更好地應對“人工智能+”浪潮下的端側(cè)AI創(chuàng)“芯”命題。
對此,Arm《芯片新思維》報告指出,在AI計算任務的推動下,芯片設(shè)計正在從“通用計算”向“定制化異構(gòu)計算”加速躍遷。尤其是面對新一輪的端側(cè)AI趨勢,新型芯片需要融合多樣化算力,形成“通用計算+專用引擎”的異構(gòu)架構(gòu),并推動以NPU為代表的專用加速器技術(shù)演進,為AI PC、AI手機、#機器人、智能汽車、智能穿戴等各類端側(cè)AI場景提供核心算力支撐。
異構(gòu)計算:融合多元算力,為端側(cè)AI構(gòu)筑計算基石
類似于人腦的神經(jīng)分區(qū)協(xié)作機制,異構(gòu)計算通過融合不同功能的算力單元,實現(xiàn)多樣化計算任務的高效協(xié)同處理。針對端側(cè)AI場景,多元異構(gòu)的SoC解決方案通常是由各類計算單元進行分工協(xié)作,例如#CPU 負責任務調(diào)度與通用計算,GPU加速圖形渲染與并行計算,NPU專攻深度學習推理。同時,異構(gòu)SoC還可根據(jù)特定端側(cè)場景需求進行靈活定制,在降低能耗的同時提升計算性能,實現(xiàn)能效比優(yōu)化。
憑借低功耗、高性能的獨特優(yōu)勢,Arm?計算平臺在端側(cè)AI異構(gòu)計算方案中發(fā)揮著底層基石作用。其中,Arm CPU作為廣泛應用于各類終端設(shè)備的“數(shù)字大腦”,不僅承擔基礎(chǔ)AI推理任務,也是AI加速器的理想搭檔,能夠高效管理數(shù)據(jù)流與通用計算任務。此外,Arm架構(gòu)還支持CPU、GPU與專用加速器的無縫集成,共同組成性能優(yōu)異的AI計算系統(tǒng)。
作為驅(qū)動全球數(shù)十億設(shè)備的關(guān)鍵技術(shù),Arm架構(gòu)在今年4月迎來了誕生40周年里程碑,正構(gòu)建AI計算的未來。立足Arm架構(gòu)的領(lǐng)先技術(shù)優(yōu)勢與龐大生態(tài)系統(tǒng),安謀科技創(chuàng)新性地將Arm CPU、GPU等通用計算單元,與安謀科技自研業(yè)務產(chǎn)品異構(gòu)融合,打造多元化、高質(zhì)量、且更符合國內(nèi)市場需求的異構(gòu)計算解決方案,全方位賦能本土端側(cè)AI計算革新。
NPU:重塑AI算力標簽,加速端側(cè)AI創(chuàng)新落地
NPU主要面向AI領(lǐng)域,是基于神經(jīng)網(wǎng)絡算法進行硬件加速的處理器統(tǒng)稱。顧名思義,NPU專門針對神經(jīng)網(wǎng)絡進行設(shè)計與優(yōu)化,擅長標量、向量和張量數(shù)學運算,可用于核心#AI 工作負載。由此,NPU也成為了新型AI終端區(qū)別于傳統(tǒng)設(shè)備的核心算力標簽。
具體來看,多數(shù)NPU采用專用架構(gòu),支持并行處理INT4/INT8/FP16低精度計算等大量矩陣運算,在保持模型精度的同時顯著降低功耗。相較于GPU,NPU能夠?qū)崿F(xiàn)更加優(yōu)異的能效比,更契合移動設(shè)備對于續(xù)航能力及成本的嚴苛要求。此外,NPU的低延遲特性也更適配于端側(cè)AI推理等計算負載,幫助減少因數(shù)據(jù)搬運而造成的能耗開銷與安全風險。
以安謀科技自研的“周易”NPU為例,歷經(jīng)多年迭代與技術(shù)沉淀,該產(chǎn)品線已構(gòu)建完整的硬件IP和Compass軟件平臺,涵蓋X系列與Z系列的多款產(chǎn)品。其中,即將于年內(nèi)面世的新一代“周易”NPU專門針對大模型特性優(yōu)化架構(gòu)設(shè)計,在顯著壓縮模型體積的同時,保持了高性能推理能力,現(xiàn)已支持Llama、Qwen、DeepSeek等多種主流大模型,可為端側(cè)AI技術(shù)普惠提供高效算力支撐。
當前,AI產(chǎn)業(yè)沿著生成式AI(Generative AI)、代理式AI(Agentic AI)、物理AI(Physical AI)的發(fā)展路徑快速演進,以人形機器人為代表的具身智能更是有望成為端側(cè)AI的下一片藍海。基于此,安謀科技將依托廣泛兼容的Arm技術(shù)生態(tài),不斷深化軟硬件協(xié)同的標準建立和端側(cè)AI生態(tài)建設(shè),攜手國內(nèi)芯片產(chǎn)業(yè)伙伴共同助推AI技術(shù)的跨越式發(fā)展。