自DeepSeek-V3.1正式發(fā)布,并在微信公眾號(hào)上放出“UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)”信息后,引發(fā)了國(guó)內(nèi)AI芯片概念股的連續(xù)上漲。東芯股份在這一輪熱潮中也斬獲頗豐,其東芯股份DRAM+礪算GPU的“存算聯(lián)”一體化布局受到市場(chǎng)的廣泛關(guān)注。
近日,東芯股份發(fā)布半年報(bào),同時(shí)發(fā)布了《關(guān)于2025年度“提質(zhì)增效重回報(bào)”行動(dòng)方案的半年度評(píng)估報(bào)告》,表示礪算科技的7G100系列基于自研TrueGPU天圖架構(gòu),從指令集到計(jì)算核心完全由自主設(shè)計(jì)。目前7G100系列已支持FP32、FP16、INT8等計(jì)算任務(wù)。但對(duì)FP8的支持,或許將是東芯股份下一步的著力方向。
布局“存算聯(lián)”協(xié)同,盈利尚需努力
以存儲(chǔ)芯片為核心布局“存算聯(lián)”一體化,是外部對(duì)東芯股份發(fā)展戰(zhàn)略的主要認(rèn)知。東芯股份的主營(yíng)業(yè)務(wù)圍繞利基型存儲(chǔ)芯片設(shè)計(jì)領(lǐng)域,是目前中國(guó)大陸為數(shù)不多能同時(shí)提供NAND Flash、NOR Flash、DRAM等存儲(chǔ)芯片完整解決方案的公司之一,產(chǎn)品主要應(yīng)用于網(wǎng)絡(luò)通信、監(jiān)控安防、消費(fèi)類(lèi)電子、工業(yè)與醫(yī)療、汽車(chē)電子等領(lǐng)域。
東芯股份還持有礪算科技37.88%的股份。礪算科技今年7月發(fā)布的自研GPU芯片“7G100”及顯卡Lisuan eXtreme系列,支持智能多任務(wù)處理、亂序渲染等技術(shù),實(shí)測(cè)在《黑神話:悟空》等大型游戲中表現(xiàn)優(yōu)異,部分參數(shù)對(duì)標(biāo)英偉達(dá)4060顯卡。在AI領(lǐng)域,7G100則可應(yīng)用于AI PC等領(lǐng)域,支持本地化AI模型。
礪算科技GPU需搭配DRAM存儲(chǔ)器,而東芯股份的DRAM產(chǎn)品可通過(guò)協(xié)同設(shè)計(jì)優(yōu)化性能。同時(shí),在連接芯片領(lǐng)域,東芯股份正持續(xù)推進(jìn)Wi-Fi 7無(wú)線通信芯片的研發(fā)設(shè)計(jì)工作。由此形成了東芯股份的“存算聯(lián)”的一體化布局。
在發(fā)布半年報(bào)同日,東芯股份還發(fā)布了《關(guān)于2025年度“提質(zhì)增效重回報(bào)”行動(dòng)方案的半年度評(píng)估報(bào)告》,表示礪算科技的 7G100 系列作為一款全自研高性能圖形 GPU,秉持創(chuàng)新融合,基于自研 TrueGPU 天圖架構(gòu),從指令集到計(jì)算核心完全由自主設(shè)計(jì)。
因此,盡管東芯股份2025年半年報(bào)錄得:主營(yíng)收入3.43億元,同比上升28.81%;歸母凈利潤(rùn)為-1.11億元,同比下降21.78%;扣非凈利潤(rùn)-1.27億元,同比下降27.59%。東芯股份依然獲得市場(chǎng)追逐?!皣?guó)產(chǎn)GPU突破+存儲(chǔ)周期反轉(zhuǎn)”或是投資者對(duì)其認(rèn)可的內(nèi)在邏輯。
DeepSeek-V3.1發(fā)布,F(xiàn)P8計(jì)算成為新熱點(diǎn)
國(guó)內(nèi)當(dāng)前AI芯片領(lǐng)域,隨著DeepSeek-V3.1的發(fā)布,支持FP8 計(jì)算正在成為行業(yè)發(fā)展熱點(diǎn)。在大模型的參數(shù)量呈指數(shù)級(jí)增長(zhǎng)的背景下,其訓(xùn)練所需的計(jì)算資源和存儲(chǔ)空間急劇攀升,采用低精度數(shù)值格式成為大模型繼續(xù)擴(kuò)容并降低訓(xùn)練成本的關(guān)鍵。FP8 是近年來(lái) AI 領(lǐng)域新興的浮點(diǎn)格式,其核心特點(diǎn)是存儲(chǔ)結(jié)構(gòu)通常采用1位符號(hào)位+ 3位指數(shù)位+ 4位尾數(shù)位(如 NVIDIA的FP8E5M2格式),或1位符號(hào)位+ 4位指數(shù)位+ 3位尾數(shù)位(如 FP8E4M3),數(shù)值范圍和精度介于FP16與INT8之間;相比FP16,F(xiàn)P8可以節(jié)省50%顯存帶寬、降低75%功耗,同時(shí)保持較高的 AI 模型精度。英偉達(dá)GPU已開(kāi)始支持 FP8,用于大模型推理。
FP8有多種表示方式,包括英偉達(dá)支持的E5M2、E4M3,以及UE8M0等。UE8M0 由 Open Compute Project(OCP)提出。OCP 是 2011 年由 Facebook(現(xiàn) Meta)聯(lián)合英特爾、Rackspace 等發(fā)起的開(kāi)源硬件協(xié)作計(jì)劃,成員包括微軟、谷歌、亞馬遜、AMD、英偉達(dá)、阿里、騰訊、百度等龍頭企業(yè)。
E5M2、E4M3盡管被英偉達(dá)支持,成為國(guó)際主流格式,但其為英偉達(dá)GPU量身定制,在其他芯片上使用存在兼容問(wèn)題。目前國(guó)產(chǎn)GPU支持FP8的還不多,如果此時(shí)都針對(duì)E4M3和E5M2進(jìn)行優(yōu)化,并不是一個(gè)最優(yōu)解。DeepSeek-V3.1通過(guò)支持UE8M0設(shè)計(jì)可以尋找一條適合國(guó)產(chǎn)GPU的技術(shù)路線,將開(kāi)啟一條“軟硬件協(xié)同”的適配路線。根據(jù)相關(guān)報(bào)道,國(guó)內(nèi)廠商中,摩爾線程MTT S5000、燧原科技燧原L600等AI芯片產(chǎn)品已原生支持FP8低精度格式。根據(jù)招股書(shū),沐曦股份在研的曦云C600也將支持FP8格式。
將在FP8方向發(fā)力?既是挑戰(zhàn)也是機(jī)會(huì)
日前,東芯股份在互動(dòng)平臺(tái)表示,礪算科技致力于研發(fā)多層次(可擴(kuò)展)圖形渲染GPU芯片,產(chǎn)品可實(shí)現(xiàn)端、云、邊的主流圖形渲染和AI加速。其7G100系列GPU芯片可支持單精度浮點(diǎn)運(yùn)算、半精度浮點(diǎn)運(yùn)算、8位整數(shù)運(yùn)算等計(jì)算任務(wù)。不同的計(jì)算精度根據(jù)其計(jì)算的性能、資源消耗及效率的不同,各有不同的適用場(chǎng)景。
單精度浮點(diǎn)(FP32)是浮點(diǎn)運(yùn)算的“基礎(chǔ)標(biāo)準(zhǔn)”,適合高精度科學(xué)計(jì)算與專(zhuān)業(yè)圖形渲染;半精度浮點(diǎn)(FP16):平衡性能與功耗,適用于 AI 推理和部分圖形任務(wù);8 位整數(shù)(INT8):面向低精度、高吞吐量場(chǎng)景(如 AI 推理、輕量化模型運(yùn)算),顯著提升能效比。三種運(yùn)算能力的支持,意味著該GPU能在“效率優(yōu)先”和“精度優(yōu)先”的場(chǎng)景間靈活切換,適配更多下游設(shè)備需求。
但根據(jù)現(xiàn)有公開(kāi)信息,東芯股份目前尚未明確7G100系列GPU芯片支持FP8計(jì)算。7G100 系列主打中端市場(chǎng),目標(biāo)場(chǎng)景包括1080P/2K游戲、輕量級(jí)AI推理(如AIPC、云渲染)和專(zhuān)業(yè)圖形設(shè)計(jì)。這些場(chǎng)景對(duì)精度需求集中在FP32(圖形渲染)、FP16(AI 推理)和INT8(邊緣計(jì)算)。這或許是東芯股份在上述方向取得突破的主要原因。
但從行業(yè)趨勢(shì)上來(lái)看,東芯股份未來(lái)可能亦將在FP8的方向發(fā)力。當(dāng)前主流 AI 框架,如TensorFlow、PyTorch對(duì)FP8的支持仍處于早期階段,且需硬件廠商提供底層驅(qū)動(dòng)和庫(kù)優(yōu)化。這對(duì)于構(gòu)建產(chǎn)業(yè)生態(tài)的國(guó)產(chǎn)AI芯片廠商來(lái)說(shuō),既是挑戰(zhàn)也是機(jī)會(huì)。