2025年開年,國產(chǎn)AI大模型DeepSeek以驚人的速度席卷科技產(chǎn)業(yè),用戶規(guī)模突破億級。作為一款基于Transformer架構(gòu)的先進推理模型,DeepSeek參數(shù)規(guī)模龐大,對硬件計算能力、內(nèi)存容量和帶寬都提出了極高要求。
奕斯偉計算在搭載了自研RISC-V AI SoC EIC77系列芯片——EIC7700X和EIC7702X的EVB開發(fā)板上,成功完成對DeepSeek模型的適配。
搭載奕斯偉計算EIC77系列芯片的EVB板
EIC7700X/7702X內(nèi)嵌NPU、GPU、DSP等硬件加速模塊,配備大容量、高帶寬的LPDDR5內(nèi)存,確保在處理DeepSeek大規(guī)模模型時能夠充分利用硬件資源,快速搬運大模型參數(shù),從而顯著提升推理效率。
測試結(jié)果顯示(見下圖),在運行7b參數(shù)規(guī)模的DeepSeek-distill-qwen模型時,搭載奕斯偉計算EIC7700X芯片的EVB開發(fā)板可達7 tokens/s的推理速度,搭載奕斯偉計算EIC7702X芯片的EVB開發(fā)板可達14 tokens/s的推理速度,展現(xiàn)出遠超同類架構(gòu)的高能效比。
奕斯偉計算RISC-V AI SoC芯片
適配DeepSeek模型測試結(jié)果
EIC77系列芯片是奕斯偉計算自主研發(fā)的12nm RISC-V AI SoC,內(nèi)嵌4核64位亂序執(zhí)行RISC-V P550 CPU和自研高性能NPU, 以及DSP、 GPU,、H.264/H.265編解碼器,芯片的AI處理性能可以達到20 TOPS INT8,可以支持32GB 存儲容量的LPDDR5@6400,支持全棧浮點計算及大語言模型。
其中,雙Die AI SoC EIC7702X內(nèi)嵌8核64位亂序RISC-V P550 CPU,AI處理能力可達40 TOPS INT8,可支持64GB存儲容量的LPDDR5@6400。
EIC7700X模塊框圖
EIC7700X(左)與EIC7702X(右)芯片
搭載EIC7700X/EIC7702X芯片的EVB板,擁有32/64 GB LPDDR存儲容量,4/8通道Gen3 PCIe接口,支持SATA3、HDMI2.0、1000M Ethernet、USB3.2、MIPI等豐富接口,可以實現(xiàn)機器視覺、目標分類、目標定位、圖像分割、動作姿態(tài)識別、自然語言處理等功能,可廣泛應(yīng)用于安全運營、智慧政務(wù)、工業(yè)檢測、智慧教育、無人駕駛、機器人、無人機、智慧交通等應(yīng)用場景。
除開發(fā)板外,EIC77系列產(chǎn)品還涵蓋AI BOX、AI PC、服務(wù)器加速卡等多種產(chǎn)品形態(tài),適用于云、邊、端等多種工作場景,多維度實現(xiàn)AI處理。
應(yīng)用場景廣泛
EIC77系列芯片短時間內(nèi)快速完成了對DeepSeek大模型的適配工作,充分展示了奕斯偉計算RISC-V AI SoC芯片的高算力利用率和開發(fā)軟件工具的通用性與便捷性,能夠適應(yīng)多種深度學習算法模型,易于使用,體現(xiàn)了奕斯偉計算的芯片與工具鏈經(jīng)過多代架構(gòu)迭代后的工程實用性。
隨著AI技術(shù)的快速發(fā)展,奕斯偉計算將沿著RISC-V+AI的技術(shù)路線,以更具性能優(yōu)勢、能效比更高的芯片與方案,不斷拓展更多應(yīng)用場景,為千行百業(yè)提供AI算力支持。