獲7家國產(chǎn)芯片支持，無問芯穹異構(gòu)云打通DeepSeek-R1多芯片適配優(yōu)化

作者：集小微 02-12 14:00

來源：鳳凰網(wǎng) #無問芯穹# #DeepSeek# #異構(gòu)云#

1.1w

鳳凰網(wǎng)科技訊 2月11日，無問芯穹宣布獲七家國產(chǎn)芯片鼎力支持，正打通DeepSeek-R1、V3在壁仞、海光、摩爾線程、沐曦、昇騰、燧原、天數(shù)智芯等七個(gè)硬件平臺的多芯片適配優(yōu)化，現(xiàn)開發(fā)者已可以通過Infini-AI異構(gòu)云平臺一鍵獲取DeepSeek系列模型與多元異構(gòu)國產(chǎn)算力服務(wù)。

自春節(jié)前夕爆火，DeepSeek已牽動了國內(nèi)超30家云服務(wù)商與近20家芯片企業(yè)宣布接入，到目前為止，這場熱鬧還只是一場由DeepSeek引發(fā)的流量蛋糕切分大戰(zhàn)。而隨著無問芯穹宣布獲7家國產(chǎn)芯片鼎力支持，并帶著多芯片適配的DeepSeek-R1入場，DeepSeek為可控國產(chǎn)算力撬動的歷史機(jī)遇，正在變得更加清晰。

獲取無問芯穹異構(gòu)云多芯片適配版DeepSeek-R1請點(diǎn)擊鏈接：https://cloud.infini-ai.com/genstudio?source=U7Z9

國產(chǎn)的大部分模型是通過國際主流芯片（如英偉達(dá)）訓(xùn)練得到，尚未與國內(nèi)的AI系統(tǒng)、芯片形成閉環(huán)生態(tài)。無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示， DeepSeek的突破激發(fā)了越來越多的下游應(yīng)用創(chuàng)造力，未來行業(yè)日均tokens消耗量將達(dá)到百萬億級別，不僅將激發(fā)國產(chǎn)芯片的市場需求，也為打造全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)，實(shí)現(xiàn)更可控的自主算力發(fā)展創(chuàng)造了有力條件。

在美國，模型、系統(tǒng)、芯片已經(jīng)形成閉環(huán)生態(tài)。以英偉達(dá)為例，其GPU的主流地位與CUDA生態(tài)有直接關(guān)系，CUDA的護(hù)城河是軟件堆棧，可以讓研究人員和軟件開發(fā)者更好地在GPU上編程和構(gòu)建各種各樣的應(yīng)用，牽引下一代芯片的迭代方向。但是隨著Transformer統(tǒng)一模型結(jié)構(gòu)，大模型應(yīng)用落地場景所需的算子數(shù)量大幅度收縮，CUDA護(hù)城河正在變薄。

“DeepSeek作為開源模型，其之于AI 2.0時(shí)代，正如Android之于移動互聯(lián)網(wǎng)革命，將重構(gòu)整個(gè)產(chǎn)業(yè)生態(tài)，引發(fā)鏈?zhǔn)椒磻?yīng)，加快上層應(yīng)用發(fā)展和下層系統(tǒng)‘統(tǒng)一’增速，由此廣泛調(diào)動起跨越軟硬件和上下游的生態(tài)，一起加大投入‘模型-芯片-系統(tǒng)’協(xié)同優(yōu)化和垂直打通，從而繼續(xù)‘打薄CUDA生態(tài)’。某種程度上來說，CUDA已經(jīng)是歷史了”。夏立雪舉例，這類協(xié)同優(yōu)化工作包括根據(jù)新一代模型架構(gòu)來定義未來芯片的底層電路實(shí)現(xiàn)，以及根據(jù)國產(chǎn)AI系統(tǒng)的互聯(lián)通信方式來設(shè)計(jì)高效的混合專家模型結(jié)構(gòu)等。

對此，無問芯穹提出了“三步走”模式來促進(jìn)全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)的打通——基于主流芯片開展極致軟硬件協(xié)同優(yōu)化，以有限算力實(shí)現(xiàn)國產(chǎn)模型能力追趕；推動國產(chǎn)芯片開放底層生態(tài)，搭建“異構(gòu)”AI系統(tǒng)解決算力缺口，實(shí)現(xiàn)模型能力趕超；構(gòu)建國產(chǎn)“同構(gòu)”系統(tǒng)，支持Scaling Law持續(xù)發(fā)展，打造“國產(chǎn)模型-國產(chǎn)芯片-國產(chǎn)系統(tǒng)”的全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)，實(shí)現(xiàn)更可控的自主算力發(fā)展。

與此同時(shí)，針對國內(nèi)源分布不均衡，技術(shù)和應(yīng)用場景不匹配，導(dǎo)致的大量異構(gòu)算力未能全量利用問題，無問芯穹也將通過整合異構(gòu)、異地、異屬算力資源，轉(zhuǎn)化為標(biāo)準(zhǔn)算力服務(wù)并規(guī)?；瘡?fù)制，并緊密跟蹤下游應(yīng)用需求，提升算力配置效率。這不僅能解決部分地區(qū)存在的算力閑置問題，滿足日益增長的應(yīng)用需求，還能在使用閉環(huán)中，促成硬件與算法正向循環(huán)。

夏立雪表示，通過打通DeepSeek-R1、V3在國產(chǎn)硬件平臺的多芯片適配優(yōu)化，無問芯穹希望進(jìn)一步團(tuán)結(jié)從模型到芯片的上下游產(chǎn)業(yè)伙伴，在打造“國產(chǎn)模型+國產(chǎn)算力+國產(chǎn)系統(tǒng)+國產(chǎn)應(yīng)用”全國產(chǎn)化AI產(chǎn)業(yè)鏈的進(jìn)程中起到牽引帶動作用，集中優(yōu)勢資源，支持模型性能長足進(jìn)步，推動中國AI自主可控長遠(yuǎn)發(fā)展，為人工智能行業(yè)發(fā)展筑牢算力基礎(chǔ)。

在DeepSeek模型迄今發(fā)布的3個(gè)大版本中，盡管參數(shù)規(guī)模實(shí)現(xiàn)十倍增長，但所使用的訓(xùn)練服務(wù)算力卻并沒有和模型尺寸等比例的成倍增加，其核心是利用軟硬件協(xié)同設(shè)計(jì)的思想，不斷提升系統(tǒng)開銷（即模型的訓(xùn)練成本）到模型尺寸、能力的轉(zhuǎn)化率。DeepSeek有力驗(yàn)證了在算力受限的條件下，軟硬協(xié)同優(yōu)化路線的有效性，特別在國內(nèi)算力受限場景下實(shí)現(xiàn)模型能力的突破，具有重要意義。

就在近日，國際最權(quán)威的科技商業(yè)媒體之一《麻省理工科技評論》刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國人工智能初創(chuàng)公司》的報(bào)道，指出階躍星辰、面壁智能、智譜AI、無問芯穹四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術(shù)實(shí)力與全球競爭力。

有業(yè)內(nèi)人士指出，結(jié)合這四家被點(diǎn)名企業(yè)的特征分析來看，DeepSeek可能正在讓國際意識到，除了DeepSeek之外，中國還存在若干路徑獨(dú)特的團(tuán)隊(duì)，在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外，找到未被五角大樓戰(zhàn)略家們關(guān)注到的“blind spot( 盲點(diǎn)) ”，跨越軟硬件，攢動上下游，走出可能出奇制勝的技術(shù)路徑。