亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

邊緣AI浪潮來襲,NPU、GPU、FPGA 架構(gòu)卡位戰(zhàn)打響

來源:愛集微 #邊緣AI# #NPU# #GPU#
6644

2025年以來,生成式AI的一個主要趨勢便是向邊緣側(cè)快速滲透,AI手機、AI PC、AI眼鏡、AIoT等應(yīng)用的熱度不斷提升,乃至有人將2025年定義為邊緣生成式AI的應(yīng)用元年。然而,在邊緣側(cè)潛力被不斷挖掘的同時,網(wǎng)絡(luò)延遲、數(shù)據(jù)安全以及隱私保護(hù)等問題也逐漸凸顯。這需要不斷推進(jìn)硬軟件技術(shù)的進(jìn)步,以滿足AI 模型市場新的需求。在此情況下,一場圍繞邊緣AI處理器的架構(gòu)卡位戰(zhàn)悄然打響。

2025,邊緣 AI 將成行業(yè)新寵

生成式AI的快速發(fā)展為諸多行業(yè)帶來新的機遇,當(dāng)下有眾多企業(yè)加速布局邊緣AI。據(jù)調(diào)研機構(gòu)Gartner預(yù)測,到2026年80%的全球企業(yè)將使用生成式AI,50%的全球邊緣部署將包含AI。邊緣AI是一種通過設(shè)備本地化處理數(shù)據(jù)的技術(shù),無需依賴云服務(wù)器。其算法被直接部署在智能手機、傳感器或物聯(lián)網(wǎng)設(shè)備上,從而實現(xiàn)快速決策、增強數(shù)據(jù)隱私、減少帶寬消耗等多重優(yōu)勢。

英特爾中國網(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超在此前接受記者采訪時表示,人工智能與邊緣計算的融合將更加深入,邊緣設(shè)備將具備更強大的智能處理能力,能夠?qū)崟r、高效地對海量數(shù)據(jù)進(jìn)行處理和分析,大大減少了數(shù)據(jù)傳輸?shù)难舆t和帶寬壓力。Imagination中國區(qū)技術(shù)總監(jiān)艾克也指出,邊緣 AI 憑借獨特的技術(shù)架構(gòu)與部署模式,在安全隱私、實時響應(yīng)、能源效率等領(lǐng)域展現(xiàn)出顯著優(yōu)勢,成為推動智能化變革的關(guān)鍵力量。

在安全隱私層面,邊緣AI將數(shù)據(jù)處理從云端下沉至本地設(shè)備或邊緣節(jié)點,數(shù)據(jù)無需長途傳輸至遠(yuǎn)程服務(wù)器,有效降低了數(shù)據(jù)在傳輸過程中被截獲、篡改或泄露的風(fēng)險。尤其在醫(yī)療、金融等對數(shù)據(jù)保密性要求極高的領(lǐng)域,敏感信息可在本地完成分析處理,數(shù)據(jù)的安全性更高。

在實時要求方面,邊緣AI無需等待數(shù)據(jù)往返云端,直接在邊緣側(cè)完成分析與指令輸出,極大縮短了延遲,對即時響應(yīng)要求更高的場景,如工業(yè)自動化、智能交通等領(lǐng)域,可以確保任務(wù)的高效執(zhí)行,滿足對實時性的苛刻要求。

在能源效率與可持續(xù)發(fā)展方面,邊緣AI減少了數(shù)據(jù)的長距離傳輸與云端大規(guī)模計算,可以降低能耗。數(shù)據(jù)中心的冷卻、服務(wù)器運行等環(huán)節(jié)均需消耗大量電力,邊緣AI分布式處理數(shù)據(jù)的模式,減少了對高能耗云端計算資源的依賴。

NPU、GPU、FPGA,硬件架構(gòu)卡位戰(zhàn)打響

隨著邊緣AI市場的擴展,一場圍繞硬件架構(gòu)的卡位戰(zhàn)也在悄然打響。NPU,即神經(jīng)網(wǎng)絡(luò)處理器,是專為人工智能計算設(shè)計的芯片,在處理神經(jīng)網(wǎng)絡(luò)算法時展現(xiàn)出極高的效率。在生成式 AI 向邊緣側(cè)快速發(fā)展的浪潮中,NPU企業(yè)憑借其獨特的優(yōu)勢積極布局,搶占市場先機。

許多MCU企業(yè)如瑞薩、恩智浦、意法半導(dǎo)體等,在推出面向邊緣AI市場的產(chǎn)品時,均選擇集成NPU。

例如,STM32N6是意法半導(dǎo)體STM32系列中首款具有AI加速能力的高性能MCU,集成1 GHz主頻NPU,計算性能可達(dá)600 GOPS,可為計算機視覺和音頻應(yīng)用提供實時神經(jīng)網(wǎng)絡(luò)推理能力?!半S著MCU的算力增強,過去一些跑在SoC上面的應(yīng)用也可以跑在MCU上。這樣可以拉低用戶BoM成本,減少外圍器件,設(shè)計的復(fù)雜性也會隨之降低。”意法半導(dǎo)體中國區(qū)微控制器、數(shù)字IC與射頻產(chǎn)品部 (MDRF) 微控制器產(chǎn)品市場經(jīng)理丁曉磊表示。

GPU 最初是為圖形處理而設(shè)計,其強大的并行計算能力在云端AI加強領(lǐng)域有著表現(xiàn)卓越。隨著邊緣市場的發(fā)展,移動GPU企業(yè)也在擴展邊緣AI市場。近日,Imagination公司推出新一代E系列GPU IP,可以支持從2 TOPS到200 TOPS(INT8精度)的AI工作負(fù)載。Imagination還嵌入新型Burst Processors(爆發(fā)式處理器)。根據(jù)Imagination公司產(chǎn)品管理副總裁 Kristof Beets介紹,這一設(shè)計改變了原本的GPU指令調(diào)度方式,在執(zhí)行爆發(fā)式的數(shù)據(jù)處理時,所有計算會優(yōu)先嘗試?yán)帽l(fā)處理器的能力,盡可能實現(xiàn)復(fù)用,減少計算開銷,平均功耗效率可以提升35%。

Altera于4月14日從英特爾獨立,重新成為全球最大的獨立FPGA半導(dǎo)體解決方案公司。獨立后的Altera可獲得更大的自主性,將深耕數(shù)據(jù)中心與邊緣AI推理等市場。FPGA作為一種可重構(gòu)的集成電路,具有靈活性高、并行處理能力強、可擴展性好等優(yōu)勢,在邊緣AI領(lǐng)域有著很多應(yīng)用優(yōu)勢,可以根據(jù)不同的應(yīng)用需求進(jìn)行硬件邏輯的重新編程,實現(xiàn)定制化的計算加速。

移動GPU vs NPU,既有優(yōu)勢也有痛點

作為專為AI計算設(shè)計的神經(jīng)網(wǎng)絡(luò)處理器,NPU在處理神經(jīng)網(wǎng)絡(luò)模型時具有很多優(yōu)勢,如高效能、低延遲,以及更高的成本效益等,特別是對于一些對實時性要求較高且相對固定的應(yīng)用場景,如智能安防、可穿戴監(jiān)測等,使用 NPU 可以在保證性能的同時,降低硬件成本。但是,這也反映出NPU存在的部分局限性,如功能相對單一、編程難度較大等。

“NPU與我們新推出的E系列GPU之間,一個重要的區(qū)別就在于——NPU 是為支持一些特定AI應(yīng)用而設(shè)計,一旦出現(xiàn)了新的應(yīng)用,NPU處理不了,這項任務(wù)就不得不被交給CPU去處理,CPU在處理這些交回的任務(wù)時往往會產(chǎn)生較大延遲,對性能的影響較大?!盞ristof Beets表示。而GPU的通用性更強,從原則上講,移動GPU不存在某個處理不了的AI任務(wù),也就不會出現(xiàn)不得不交給其他的處理單元兜底的情況。這對用戶應(yīng)對快速更新迭代的AI行業(yè)十分重要。

此外,GPU在軟件工具與生態(tài)上也更具優(yōu)勢。目前 NPU 的編程框架和開發(fā)工具相對較少,且不同廠家的 NPU 架構(gòu)和指令集差異較大,開發(fā)者需要針對具體的 NPU 進(jìn)行專門的開發(fā)和優(yōu)化,這增加了開發(fā)的難度和成本。GPU有更成熟的編程框架和開發(fā)工具,行業(yè)內(nèi)熟悉GPU編程的人才也更多,這使GPU在AI生態(tài)系統(tǒng)上擁有一定優(yōu)勢。

存算一體,競逐邊緣AI新勢力

值得關(guān)注的是,新一代存算一體技術(shù)正在嶄露頭角,也為邊緣AI領(lǐng)域帶來了更多極具潛力的應(yīng)用方向。有業(yè)內(nèi)專家指出,傳統(tǒng)的馮?諾依曼架構(gòu)在面對日益增長的 AI 計算需求時,遭遇了“存儲墻”難題,數(shù)據(jù)在存儲單元與計算單元之間頻繁搬運,不僅耗費大量時間,還導(dǎo)致能耗大幅增加,嚴(yán)重制約了計算效率的提升。存算一體技術(shù)則通過將存儲和計算功能緊密集成在同一芯片上,有效規(guī)避了這一問題,為邊緣 AI 發(fā)展開辟了新路徑。

邊緣設(shè)備通常受限于能源供應(yīng),對功耗要求極為嚴(yán)苛。存算一體技術(shù)讓數(shù)據(jù)在存儲位置附近即可完成計算,大幅減少了數(shù)據(jù)傳輸過程中的能耗。以智能安防攝像頭為例,這類設(shè)備需實時處理大量視頻數(shù)據(jù)以進(jìn)行目標(biāo)檢測和識別。運用存算一體技術(shù),攝像頭可在本地高效運行 AI 算法,快速分析視頻流中的人物、車輛等目標(biāo),同時降低設(shè)備整體功耗,延長電池續(xù)航時間或減少外接電源的依賴,尤其適用于一些難以布線供電的戶外監(jiān)控場景。

目前已有多家國內(nèi)企業(yè)推出面向邊緣AI應(yīng)用的存算一體產(chǎn)品。如知存科技已量產(chǎn)旗下存算一體SoC芯片WTM2101,從幾十Mops到幾Gops,功耗低至亞毫安,還能同時運行多個深度學(xué)習(xí)算法,適用于語音識別、語音增強、健康監(jiān)測、環(huán)境識別、遠(yuǎn)場喚醒、事件檢測等多個應(yīng)用場景。

蘋芯科技近日面向終端側(cè)模型,推出基于SRAM的存算一體NPU IP N30,用戶基于NPU可以打造端側(cè)SoC、MCU等產(chǎn)品,動態(tài)精度引擎支持4-16bit混合精度,語音模型量化后精度損失<3‰,單核0.5TOPS,十六核集群可達(dá)8TOPS。

后摩智能推出的后摩漫界M30 芯片,算力達(dá)到100TOPS,功耗僅12W左右,每瓦特計算效率高達(dá)7 - 8TOPS 。億鑄科技自研的YICA軟件棧,不僅支持算子的“一鍵生成”和“自動優(yōu)化”,還能兼容現(xiàn)有主流深度學(xué)習(xí)框架,大幅降低了大模型部署和遷移成本。

總之,邊緣AI作為一個新興的應(yīng)用市場,正吸引不同架構(gòu)、不同陣營的廠商進(jìn)入。隨著未來市場規(guī)模的擴大,不同的解決方案之間的角力也將全面展開。

責(zé)編: 張軼群
來源:愛集微 #邊緣AI# #NPU# #GPU#
THE END

*此內(nèi)容為集微網(wǎng)原創(chuàng),著作權(quán)歸集微網(wǎng)所有,愛集微,愛原創(chuàng)

關(guān)閉
加載

PDF 加載中...

天天舔操操操av| 国产一区二区在线观看精品| 亚洲福利小视频在线观看| 欧美一区二区三区高清性群p| 日韩无码av三级片| 国产一区二区在线观看精品| 国产精品三二一免费| 涩涩屋操美女视频| 欧美久久精品免费看C片| 少妇毛片一区二区三区免费视频| 护士毛片在线看中文字幕| 熟妇丰满大阴户熟妇啪啪| 国产精品亚洲一区二区三区下载| 女生的鸡鸡色色软件 | 大粗鳮巴r教师人妻91| 大胸瑟瑟黑丝午夜| 亚洲av熟妇高潮精品啪啪| 白嫩在线亚洲观看| 呦交小u女国产精品99| 国产精品视频一区二区三区分享| 尤物性生活午夜在线视频| 玩弄邻居少妇呻吟11p| 亚洲精品国产人久久| 操逼动漫首页登录| 少妇勾搭外卖员在线观看| 亚洲午夜国产片在线观看| 精品久久久久久不卡亚洲| 怎么样操女人的逼亚洲Av黄片段| 成人黄色精品久久app| 九九视频免费在线观看| 亚洲av伦理一区二区三区久久| 国产区高清在线一区二区三区| 日本亚洲免费不卡| 91秦先生全集在线观看| 精品国产Av无码久久久一区二区| 欧美高清一二三区| 韩国精品视频一区二区在线观看| 三级片成人京东热五月天| 欧美日韩视频在线一区二区| 怎么样操女人的逼亚洲Av黄片段 | 插女人下面高潮视频|