4月29日,阿里云正式發(fā)布Qwen3系列的8款開(kāi)源混合推理模型。摩爾線程團(tuán)隊(duì)在模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。這一成果充分展現(xiàn)了MUSA架構(gòu)及全功能GPU在生態(tài)兼容性和快速支持能力方面的卓越表現(xiàn)。MUSA架構(gòu)憑借其強(qiáng)大的易用性,不僅顯著降低了開(kāi)發(fā)者在適配遷移過(guò)程中的工作量,更大幅提升了開(kāi)發(fā)效率,為創(chuàng)新成果的快速落地提供了堅(jiān)實(shí)助力。
Qwen3作為國(guó)內(nèi)首個(gè)“混合推理模型”,創(chuàng)造性將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,在推理、指令遵循、智能體功能和多語(yǔ)言支持方面取得了突破性的進(jìn)步。此次開(kāi)源的兩款MoE模型是Qwen3-235B-A22B和Qwen3-30B-A3B;同時(shí)還包括六個(gè)Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
從官方發(fā)布的benchmark測(cè)試結(jié)果來(lái)看:Qwen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,成績(jī)顯著高于OpenAI-o1及Deepseek-R1版本。Qwen3-32B在各項(xiàng)測(cè)試中成績(jī)同樣優(yōu)于OpenAI-o3-mini。
快速支持 開(kāi)放體驗(yàn)Qwen3創(chuàng)新成果
摩爾線程現(xiàn)已將Qwen3系列模型的支持成果在“夸娥工場(chǎng)”開(kāi)放上線。“夸娥工場(chǎng)”是摩爾線程傾力打造的模型展示與體驗(yàn)中心,旨在為用戶(hù)提供基于夸娥(KUAE)智算集群支持的模型能力體驗(yàn)。用戶(hù)可通過(guò)訪問(wèn)夸娥工場(chǎng),親身體驗(yàn)Qwen3強(qiáng)大的推理模型性能與創(chuàng)新技術(shù)。
▼ 夸娥工場(chǎng)”體驗(yàn)地址:
https://playground.mthreads.com
▼ Qwen3體驗(yàn)地址:
https://playground.mthreads.com:12074/
目前,主流推理引擎均可基于摩爾線程MUSA平臺(tái)運(yùn)行Qwen3系列模型。MUSA平臺(tái)憑借其卓越性能,能夠作為vLLM、Ollama、GPU Stack等各類(lèi)主流開(kāi)源推理引擎的后端,為Qwen3系列模型的高效運(yùn)行提供強(qiáng)大動(dòng)力。
例如,QWen3-235B-A22B(Qwen3系列最大參數(shù)量模型),基于vLLM-MUSA引擎在摩爾線程全功能GPU上穩(wěn)定運(yùn)行。
圖示:QWen3-235B-A22B模型在vLLM-MUSA引擎適配
同時(shí),GPU Stack引擎與llama.cpp/ollama引擎也在摩爾線程圖形顯卡MTT S80上高效運(yùn)行,充分展現(xiàn)了MUSA平臺(tái)的廣泛兼容性與卓越性能。
圖示:GPU Stack引擎在MTT S80上運(yùn)行
圖示:llama.cpp/ollama引擎在MTT S80上運(yùn)行
共建開(kāi)源生態(tài) 持續(xù)推動(dòng)國(guó)產(chǎn)GPU發(fā)展
摩爾線程積極響應(yīng)開(kāi)源社區(qū)的號(hào)召,旨在賦能更多開(kāi)發(fā)者基于國(guó)產(chǎn)全功能GPU進(jìn)行AI應(yīng)用創(chuàng)新。此前,在通義千問(wèn)QwQ-32B發(fā)布當(dāng)日,摩爾線程就成功實(shí)現(xiàn)了Day-0支持,這一成果充分驗(yàn)證了先進(jìn)MUSA架構(gòu)和全功能GPU的技術(shù)成熟度與可靠性。
我們誠(chéng)摯歡迎廣大開(kāi)發(fā)者與用戶(hù)前往“夸娥工場(chǎng)”進(jìn)行體驗(yàn),與此同時(shí),開(kāi)發(fā)者也可訪問(wèn)摩爾線程GitHub社區(qū)與開(kāi)發(fā)者社區(qū)了解更多:
▼ 摩爾線程GitHub開(kāi)源社區(qū):
https://github.com/MooreThreads
▼ 摩爾線程開(kāi)發(fā)者社區(qū):
https://developer.mthreads.com/
摩爾線程始終致力于推動(dòng)開(kāi)源生態(tài)的發(fā)展,通過(guò)技術(shù)開(kāi)放與生態(tài)共建,加速?lài)?guó)產(chǎn)全功能GPU在AI計(jì)算領(lǐng)域的規(guī)模化應(yīng)用,為更多用戶(hù)提供更智能、高效的解決方案。