近日,海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek V3和R1模型與海光DCU(深度計(jì)算單元)的適配,并正式上線!
用戶現(xiàn)可通過(guò)“光合開(kāi)發(fā)者社區(qū)”中的“光源”板塊訪問(wèn)并下載相關(guān)模型,即可基于DCU平臺(tái)快速部署和使用相關(guān)模型。
DeepSeek V3和R1模型采用了Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌預(yù)測(cè)、FP8混合精度訓(xùn)練等創(chuàng)新技術(shù),顯著提升了模型的訓(xùn)練效率和推理性能。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計(jì)算解決方案。憑借卓越的算力性能和完備的軟件生態(tài),DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
海光DCU技術(shù)團(tuán)隊(duì)表示,將持續(xù)推動(dòng)大模型迭代適配與優(yōu)化更新,攜手更多優(yōu)秀大模型企業(yè)為行業(yè)客戶提供更高效、更經(jīng)濟(jì)、更安全的AI解決方案。同時(shí),團(tuán)隊(duì)也將積極探索更多應(yīng)用場(chǎng)景,推動(dòng)AI技術(shù)在更多行業(yè)的落地與普及。