FP8：或?qū)⑹菛|芯股份的下一步著力方向

作者：陳炳欣 08-26 14:47

來(lái)源：愛(ài)集微 #東芯股份# #AI芯片# #FP8#

1.3w

自DeepSeek-V3.1正式發(fā)布，并在微信公眾號(hào)上放出“UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)”信息后，引發(fā)了國(guó)內(nèi)AI芯片概念股的連續(xù)上漲。東芯股份在這一輪熱潮中也斬獲頗豐，其東芯股份DRAM+礪算GPU的“存算聯(lián)”一體化布局受到市場(chǎng)的廣泛關(guān)注。

近日，東芯股份發(fā)布半年報(bào)，同時(shí)發(fā)布了《關(guān)于2025年度“提質(zhì)增效重回報(bào)”行動(dòng)方案的半年度評(píng)估報(bào)告》，表示礪算科技的7G100系列基于自研TrueGPU天圖架構(gòu)，從指令集到計(jì)算核心完全由自主設(shè)計(jì)。目前7G100系列已支持FP32、FP16、INT8等計(jì)算任務(wù)。但對(duì)FP8的支持，或許將是東芯股份下一步的著力方向。

布局“存算聯(lián)”協(xié)同，盈利尚需努力

以存儲(chǔ)芯片為核心布局“存算聯(lián)”一體化，是外部對(duì)東芯股份發(fā)展戰(zhàn)略的主要認(rèn)知。東芯股份的主營(yíng)業(yè)務(wù)圍繞利基型存儲(chǔ)芯片設(shè)計(jì)領(lǐng)域，是目前中國(guó)大陸為數(shù)不多能同時(shí)提供NAND Flash、NOR Flash、DRAM等存儲(chǔ)芯片完整解決方案的公司之一，產(chǎn)品主要應(yīng)用于網(wǎng)絡(luò)通信、監(jiān)控安防、消費(fèi)類(lèi)電子、工業(yè)與醫(yī)療、汽車(chē)電子等領(lǐng)域。

東芯股份還持有礪算科技37.88%的股份。礪算科技今年7月發(fā)布的自研GPU芯片“7G100”及顯卡Lisuan eXtreme系列，支持智能多任務(wù)處理、亂序渲染等技術(shù)，實(shí)測(cè)在《黑神話：悟空》等大型游戲中表現(xiàn)優(yōu)異，部分參數(shù)對(duì)標(biāo)英偉達(dá)4060顯卡。在AI領(lǐng)域，7G100則可應(yīng)用于AI PC等領(lǐng)域，支持本地化AI模型。

礪算科技GPU需搭配DRAM存儲(chǔ)器，而東芯股份的DRAM產(chǎn)品可通過(guò)協(xié)同設(shè)計(jì)優(yōu)化性能。同時(shí)，在連接芯片領(lǐng)域，東芯股份正持續(xù)推進(jìn)Wi-Fi 7無(wú)線通信芯片的研發(fā)設(shè)計(jì)工作。由此形成了東芯股份的“存算聯(lián)”的一體化布局。

在發(fā)布半年報(bào)同日，東芯股份還發(fā)布了《關(guān)于2025年度“提質(zhì)增效重回報(bào)”行動(dòng)方案的半年度評(píng)估報(bào)告》，表示礪算科技的 7G100 系列作為一款全自研高性能圖形 GPU，秉持創(chuàng)新融合，基于自研 TrueGPU 天圖架構(gòu)，從指令集到計(jì)算核心完全由自主設(shè)計(jì)。

因此，盡管東芯股份2025年半年報(bào)錄得：主營(yíng)收入3.43億元，同比上升28.81%；歸母凈利潤(rùn)為-1.11億元，同比下降21.78%；扣非凈利潤(rùn)-1.27億元，同比下降27.59%。東芯股份依然獲得市場(chǎng)追逐?！皣?guó)產(chǎn)GPU突破+存儲(chǔ)周期反轉(zhuǎn)”或是投資者對(duì)其認(rèn)可的內(nèi)在邏輯。

DeepSeek-V3.1發(fā)布，F(xiàn)P8計(jì)算成為新熱點(diǎn)

國(guó)內(nèi)當(dāng)前AI芯片領(lǐng)域，隨著DeepSeek-V3.1的發(fā)布，支持FP8 計(jì)算正在成為行業(yè)發(fā)展熱點(diǎn)。在大模型的參數(shù)量呈指數(shù)級(jí)增長(zhǎng)的背景下，其訓(xùn)練所需的計(jì)算資源和存儲(chǔ)空間急劇攀升，采用低精度數(shù)值格式成為大模型繼續(xù)擴(kuò)容并降低訓(xùn)練成本的關(guān)鍵。FP8 是近年來(lái) AI 領(lǐng)域新興的浮點(diǎn)格式，其核心特點(diǎn)是存儲(chǔ)結(jié)構(gòu)通常采用1位符號(hào)位+ 3位指數(shù)位+ 4位尾數(shù)位（如 NVIDIA的FP8E5M2格式），或1位符號(hào)位+ 4位指數(shù)位+ 3位尾數(shù)位（如 FP8E4M3），數(shù)值范圍和精度介于FP16與INT8之間；相比FP16，F(xiàn)P8可以節(jié)省50%顯存帶寬、降低75%功耗，同時(shí)保持較高的 AI 模型精度。英偉達(dá)GPU已開(kāi)始支持 FP8，用于大模型推理。

FP8有多種表示方式，包括英偉達(dá)支持的E5M2、E4M3，以及UE8M0等。UE8M0 由 Open Compute Project（OCP）提出。OCP 是 2011 年由 Facebook（現(xiàn) Meta）聯(lián)合英特爾、Rackspace 等發(fā)起的開(kāi)源硬件協(xié)作計(jì)劃，成員包括微軟、谷歌、亞馬遜、AMD、英偉達(dá)、阿里、騰訊、百度等龍頭企業(yè)。

E5M2、E4M3盡管被英偉達(dá)支持，成為國(guó)際主流格式，但其為英偉達(dá)GPU量身定制，在其他芯片上使用存在兼容問(wèn)題。目前國(guó)產(chǎn)GPU支持FP8的還不多，如果此時(shí)都針對(duì)E4M3和E5M2進(jìn)行優(yōu)化，并不是一個(gè)最優(yōu)解。DeepSeek-V3.1通過(guò)支持UE8M0設(shè)計(jì)可以尋找一條適合國(guó)產(chǎn)GPU的技術(shù)路線，將開(kāi)啟一條“軟硬件協(xié)同”的適配路線。根據(jù)相關(guān)報(bào)道，國(guó)內(nèi)廠商中，摩爾線程MTT S5000、燧原科技燧原L600等AI芯片產(chǎn)品已原生支持FP8低精度格式。根據(jù)招股書(shū)，沐曦股份在研的曦云C600也將支持FP8格式。

將在FP8方向發(fā)力？既是挑戰(zhàn)也是機(jī)會(huì)

日前，東芯股份在互動(dòng)平臺(tái)表示，礪算科技致力于研發(fā)多層次（可擴(kuò)展）圖形渲染GPU芯片，產(chǎn)品可實(shí)現(xiàn)端、云、邊的主流圖形渲染和AI加速。其7G100系列GPU芯片可支持單精度浮點(diǎn)運(yùn)算、半精度浮點(diǎn)運(yùn)算、8位整數(shù)運(yùn)算等計(jì)算任務(wù)。不同的計(jì)算精度根據(jù)其計(jì)算的性能、資源消耗及效率的不同，各有不同的適用場(chǎng)景。

單精度浮點(diǎn)（FP32）是浮點(diǎn)運(yùn)算的“基礎(chǔ)標(biāo)準(zhǔn)”，適合高精度科學(xué)計(jì)算與專(zhuān)業(yè)圖形渲染；半精度浮點(diǎn)（FP16）：平衡性能與功耗，適用于 AI 推理和部分圖形任務(wù)；8 位整數(shù)（INT8）：面向低精度、高吞吐量場(chǎng)景（如 AI 推理、輕量化模型運(yùn)算），顯著提升能效比。三種運(yùn)算能力的支持，意味著該GPU能在“效率優(yōu)先”和“精度優(yōu)先”的場(chǎng)景間靈活切換，適配更多下游設(shè)備需求。

但根據(jù)現(xiàn)有公開(kāi)信息，東芯股份目前尚未明確7G100系列GPU芯片支持FP8計(jì)算。7G100 系列主打中端市場(chǎng)，目標(biāo)場(chǎng)景包括1080P/2K游戲、輕量級(jí)AI推理（如AIPC、云渲染）和專(zhuān)業(yè)圖形設(shè)計(jì)。這些場(chǎng)景對(duì)精度需求集中在FP32（圖形渲染）、FP16（AI 推理）和INT8（邊緣計(jì)算）。這或許是東芯股份在上述方向取得突破的主要原因。

但從行業(yè)趨勢(shì)上來(lái)看，東芯股份未來(lái)可能亦將在FP8的方向發(fā)力。當(dāng)前主流 AI 框架，如TensorFlow、PyTorch對(duì)FP8的支持仍處于早期階段，且需硬件廠商提供底層驅(qū)動(dòng)和庫(kù)優(yōu)化。這對(duì)于構(gòu)建產(chǎn)業(yè)生態(tài)的國(guó)產(chǎn)AI芯片廠商來(lái)說(shuō)，既是挑戰(zhàn)也是機(jī)會(huì)。