我國人工智能技術產(chǎn)業(yè)近來取得顯著進步,多款新發(fā)布的大模型已達到國際先進水平。我國AI芯片企業(yè)也在積極行動,和各國產(chǎn)大模型開展適配,共同構建智能計算產(chǎn)業(yè)生態(tài)。作為國家權威技術驗證平臺,中國信息通信研究院(簡稱:中國信通院)依托“人工智能芯片測試評估公共服務平臺”,構建了AI芯片與大模型協(xié)同適配的標準化體系,為產(chǎn)業(yè)鏈上下游深度合作提供關鍵支撐,并開展AI芯片與大模型的適配驗證工作,通過多項舉措促進AI芯片與大模型的協(xié)同發(fā)展。
經(jīng)中國信息通信研究院檢測,在本次AI芯片與模型適配驗證項目中,摩爾線程自主研發(fā)的訓推一體計算卡摩爾線程 MTT S4000和杭州深度求索人工智能基礎技術研究有限公司研發(fā)的 DeepSeek-R1 671B 大模型,在推理場景下的適配結果符合“AI芯片和大模型通過性適配要求”,成功通過中國信通院《AI芯片和大模型適配能力通過性評測軟硬件環(huán)境及測試細則》推理場景驗證。摩爾線程MTT S4000可實現(xiàn)正常、穩(wěn)定運行,滿足推理使用需求,符合通過性適配驗證條件,并獲頒檢測證書。目前,摩爾線程系列訓推一體計算卡正在開展優(yōu)化性適配驗證工作,相關結果將在檢測流程結束后另行公布。
MTT S4000 是基于摩爾線程全功能GPU架構,專為大模型打造的訓推一體通用計算卡,支持 FP64/FP32/TF32/FP16/BF16/INT8 等完整計算精度,配備48GB 高性能顯存。憑借摩爾線程自研MTLink 1.0技術,MTT S4000可實現(xiàn)多卡互聯(lián)及千卡集群部署,為千億參數(shù)大模型的訓練、微調和推理提供強勁算力支撐。同時,它還兼具先進的圖形渲染、視頻編解碼和超高清8K HDR顯示能力,可滿足人工智能、科學計算、多媒體處理等復合場景需求。
MTT S4000此次能夠快速完成DeepSeek R1-671B大模型的適配驗證,主要得益于包括vLLM-MUSA推理框架、MUTLASS、Triton-MUSA等在內的完善的MUSA生態(tài)軟件棧和快捷開發(fā)實踐。這些技術優(yōu)勢既體現(xiàn)了MUSA軟件棧的高效適配能力,也使其整體性能達到行業(yè)主流水平,彰顯了摩爾線程在國產(chǎn)GPU技術創(chuàng)新和生態(tài)建設方面的強大實力。
近期,摩爾線程還推出了搭載MTT S4000的MCCX DeepSeek大模型一體機,該產(chǎn)品深度融合國產(chǎn)全功能GPU、深度優(yōu)化的高性能推理引擎和軟件棧,全面支持從蒸餾版到671B參數(shù)全量版DeepSeek模型的部署需求,可靈活適配廣泛的行業(yè)、場景和應用。通過摩爾線程硬件到軟件的自主技術鏈,該一體機可實現(xiàn)開箱即用、安全可控的一站式大模型服務,從而為政企客戶提供高效易用的國產(chǎn)化AI基礎設施,顯著降低大模型應用門檻。