即刻適配！壁仞科技完成Qwen3全系列模型支持

作者：愛集微 3小時前

來源：壁仞科技 #壁仞科技# #Qwen3#

1355

4月29日，阿里巴巴通義千問發(fā)布并開源8款新版Qwen3系列“混合推理模型”（簡稱“Qwen3”）。Qwen3發(fā)布后數(shù)小時內(nèi)，壁仞科技完成全系列支持，并率先在壁仞科技開發(fā)者云平臺上線。

性能卓越，Qwen3部署成本大幅下降

Qwen3包括兩款混合專家（MoE）模型Qwen3-235B-A22B和Qwen3-30B-A3B；同時還包括六個密集（Dense）模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。從官方披露的數(shù)據(jù)來看，旗艦?zāi)Ｐ蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中，與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比，表現(xiàn)出極具競爭力的結(jié)果。此外，小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%，表現(xiàn)更勝一籌。

基于廣泛的訓(xùn)練，Qwen3在推理、指令跟隨、Agent能力和多語言支持方面取得了突破性的進展，不僅是國內(nèi)首個“混合推理模型”，“快思考”與“慢思考”集成進同一個模型，大大節(jié)省算力消耗；部署成本大也幅下降，顯存占用僅為性能相近模型的三分之一。

極速響應(yīng)，數(shù)小時全系列適配

壁仞科技依托自研的壁礪?系列通用GPU架構(gòu)與深度優(yōu)化的軟件棧，在Qwen3正式發(fā)布后，僅用數(shù)小時完成Qwen3全系列模型的適配工作，并成功上線開發(fā)者云平臺。