4月29日,阿里巴巴通義千問發(fā)布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時內(nèi),壁仞科技完成全系列支持,并率先在壁仞科技開發(fā)者云平臺上線。
性能卓越,Qwen3部署成本大幅下降
Qwen3包括兩款混合專家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同時還包括六個密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。從官方披露的數(shù)據(jù)來看,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌。
基于廣泛的訓(xùn)練,Qwen3在推理、指令跟隨、Agent能力和多語言支持方面取得了突破性的進展,不僅是國內(nèi)首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,大大節(jié)省算力消耗;部署成本大也幅下降,顯存占用僅為性能相近模型的三分之一。
極速響應(yīng),數(shù)小時全系列適配
壁仞科技依托自研的壁礪?系列通用GPU架構(gòu)與深度優(yōu)化的軟件棧,在Qwen3正式發(fā)布后,僅用數(shù)小時完成Qwen3全系列模型的適配工作,并成功上線開發(fā)者云平臺。
與此同時,壁仞科技快速響應(yīng),推出基于壁礪?系列一體機,包括便捷4卡機、通用8卡機、高密16卡機,全面支持Qwen3全系列模型。
Qwen3開源更重要的行業(yè)意義在于推動大模型技術(shù)的普惠和應(yīng)用的落地。據(jù)相關(guān)媒體報道,Qwen3顯著降低了設(shè)備適配的技術(shù)門檻以及部署成本,可滿足海量中小企業(yè)和AI開發(fā)者的需求,從而加速AI推理應(yīng)用落地。
如若了解壁仞科技Qwen3全系列模型推理一體機的更多詳情,請聯(lián)系Myuan@birentech.com溝通合作。用戶點擊此處即可體驗部分模型。