鳳凰網(wǎng)科技訊 2月11日,無問芯穹宣布獲七家國產(chǎn)芯片鼎力支持,正打通DeepSeek-R1、V3在壁仞、海光、摩爾線程、沐曦、昇騰、燧原、天數(shù)智芯等七個(gè)硬件平臺的多芯片適配優(yōu)化,現(xiàn)開發(fā)者已可以通過Infini-AI異構(gòu)云平臺一鍵獲取DeepSeek系列模型與多元異構(gòu)國產(chǎn)算力服務(wù)。
自春節(jié)前夕爆火,DeepSeek已牽動了國內(nèi)超30家云服務(wù)商與近20家芯片企業(yè)宣布接入,到目前為止,這場熱鬧還只是一場由DeepSeek引發(fā)的流量蛋糕切分大戰(zhàn)。而隨著無問芯穹宣布獲7家國產(chǎn)芯片鼎力支持,并帶著多芯片適配的DeepSeek-R1入場,DeepSeek為可控國產(chǎn)算力撬動的歷史機(jī)遇,正在變得更加清晰。
獲取無問芯穹異構(gòu)云多芯片適配版DeepSeek-R1請點(diǎn)擊鏈接:https://cloud.infini-ai.com/genstudio?source=U7Z9
國產(chǎn)的大部分模型是通過國際主流芯片(如英偉達(dá))訓(xùn)練得到,尚未與國內(nèi)的AI系統(tǒng)、芯片形成閉環(huán)生態(tài)。無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示, DeepSeek的突破激發(fā)了越來越多的下游應(yīng)用創(chuàng)造力,未來行業(yè)日均tokens消耗量將達(dá)到百萬億級別,不僅將激發(fā)國產(chǎn)芯片的市場需求,也為打造全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現(xiàn)更可控的自主算力發(fā)展創(chuàng)造了有力條件。
在美國,模型、系統(tǒng)、芯片已經(jīng)形成閉環(huán)生態(tài)。以英偉達(dá)為例,其GPU的主流地位與CUDA生態(tài)有直接關(guān)系,CUDA的護(hù)城河是軟件堆棧,可以讓研究人員和軟件開發(fā)者更好地在GPU上編程和構(gòu)建各種各樣的應(yīng)用,牽引下一代芯片的迭代方向。但是隨著Transformer統(tǒng)一模型結(jié)構(gòu),大模型應(yīng)用落地場景所需的算子數(shù)量大幅度收縮,CUDA護(hù)城河正在變薄。
“DeepSeek作為開源模型,其之于AI 2.0時(shí)代,正如Android之于移動互聯(lián)網(wǎng)革命,將重構(gòu)整個(gè)產(chǎn)業(yè)生態(tài),引發(fā)鏈?zhǔn)椒磻?yīng),加快上層應(yīng)用發(fā)展和下層系統(tǒng)‘統(tǒng)一’增速,由此廣泛調(diào)動起跨越軟硬件和上下游的生態(tài),一起加大投入‘模型-芯片-系統(tǒng)’協(xié)同優(yōu)化和垂直打通,從而繼續(xù)‘打薄CUDA生態(tài)’。某種程度上來說,CUDA已經(jīng)是歷史了”。夏立雪舉例,這類協(xié)同優(yōu)化工作包括根據(jù)新一代模型架構(gòu)來定義未來芯片的底層電路實(shí)現(xiàn),以及根據(jù)國產(chǎn)AI系統(tǒng)的互聯(lián)通信方式來設(shè)計(jì)高效的混合專家模型結(jié)構(gòu)等。
對此,無問芯穹提出了“三步走”模式來促進(jìn)全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)的打通——基于主流芯片開展極致軟硬件協(xié)同優(yōu)化,以有限算力實(shí)現(xiàn)國產(chǎn)模型能力追趕;推動國產(chǎn)芯片開放底層生態(tài),搭建“異構(gòu)”AI系統(tǒng)解決算力缺口,實(shí)現(xiàn)模型能力趕超;構(gòu)建國產(chǎn)“同構(gòu)”系統(tǒng),支持Scaling Law持續(xù)發(fā)展,打造“國產(chǎn)模型-國產(chǎn)芯片-國產(chǎn)系統(tǒng)”的全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現(xiàn)更可控的自主算力發(fā)展。
與此同時(shí),針對國內(nèi)源分布不均衡,技術(shù)和應(yīng)用場景不匹配,導(dǎo)致的大量異構(gòu)算力未能全量利用問題,無問芯穹也將通過整合異構(gòu)、異地、異屬算力資源,轉(zhuǎn)化為標(biāo)準(zhǔn)算力服務(wù)并規(guī)?;瘡?fù)制,并緊密跟蹤下游應(yīng)用需求,提升算力配置效率。這不僅能解決部分地區(qū)存在的算力閑置問題,滿足日益增長的應(yīng)用需求,還能在使用閉環(huán)中,促成硬件與算法正向循環(huán)。
夏立雪表示,通過打通DeepSeek-R1、V3在國產(chǎn)硬件平臺的多芯片適配優(yōu)化,無問芯穹希望進(jìn)一步團(tuán)結(jié)從模型到芯片的上下游產(chǎn)業(yè)伙伴,在打造“國產(chǎn)模型+國產(chǎn)算力+國產(chǎn)系統(tǒng)+國產(chǎn)應(yīng)用”全國產(chǎn)化AI產(chǎn)業(yè)鏈的進(jìn)程中起到牽引帶動作用,集中優(yōu)勢資源,支持模型性能長足進(jìn)步,推動中國AI自主可控長遠(yuǎn)發(fā)展,為人工智能行業(yè)發(fā)展筑牢算力基礎(chǔ)。
在DeepSeek模型迄今發(fā)布的3個(gè)大版本中,盡管參數(shù)規(guī)模實(shí)現(xiàn)十倍增長,但所使用的訓(xùn)練服務(wù)算力卻并沒有和模型尺寸等比例的成倍增加,其核心是利用軟硬件協(xié)同設(shè)計(jì)的思想,不斷提升系統(tǒng)開銷(即模型的訓(xùn)練成本)到模型尺寸、能力的轉(zhuǎn)化率。DeepSeek有力驗(yàn)證了在算力受限的條件下,軟硬協(xié)同優(yōu)化路線的有效性,特別在國內(nèi)算力受限場景下實(shí)現(xiàn)模型能力的突破,具有重要意義。
就在近日,國際最權(quán)威的科技商業(yè)媒體之一《麻省理工科技評論》刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國人工智能初創(chuàng)公司》的報(bào)道,指出階躍星辰、面壁智能、智譜AI、無問芯穹四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術(shù)實(shí)力與全球競爭力。
有業(yè)內(nèi)人士指出,結(jié)合這四家被點(diǎn)名企業(yè)的特征分析來看,DeepSeek可能正在讓國際意識到,除了DeepSeek之外,中國還存在若干路徑獨(dú)特的團(tuán)隊(duì),在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外,找到未被五角大樓戰(zhàn)略家們關(guān)注到的“blind spot( 盲點(diǎn)) ”,跨越軟硬件,攢動上下游,走出可能出奇制勝的技術(shù)路徑。