4月29日,阿里巴巴通義千問發(fā)布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時內(nèi),壁仞科技完成全系列支持,并率先在壁仞科技開發(fā)者云平臺上線。
性能卓越,Qwen3部署成本大幅下降
Qwen3包括兩款混合專家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同時還包括六個密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。從官方披露的數(shù)據(jù)來看,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準測試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌。
基于廣泛的訓(xùn)練,Qwen3在推理、指令跟隨、Agent能力和多語言支持方面取得了突破性的進展,不僅是國內(nèi)首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,大大節(jié)省算力消耗;部署成本大也幅下降,顯存占用僅為性能相近模型的三分之一。
極速響應(yīng),數(shù)小時全系列適配
壁仞科技依托自研的壁礪系列通用GPU架構(gòu)與深度優(yōu)化的軟件棧,在Qwen3正式發(fā)布后,僅用數(shù)小時完成Qwen3全系列模型的適配工作,并成功上線開發(fā)者云平臺。
與此同時,壁仞科技快速響應(yīng),推出基于壁礪系列一體機,包括便捷4卡機、通用8卡機、高密16卡機,全面支持Qwen3全系列模型。
Qwen3開源更重要的行業(yè)意義在于推動大模型技術(shù)的普惠和應(yīng)用的落地。據(jù)相關(guān)媒體報道,Qwen3顯著降低了設(shè)備適配的技術(shù)門檻以及部署成本,可滿足海量中小企業(yè)和AI開發(fā)者的需求,從而加速AI推理應(yīng)用落地。
用戶訪問以下鏈接或點擊閱讀全文即可體驗部分模型:
https://sgc.birentech.com:5000/
-
阿里巴巴
+關(guān)注
關(guān)注
7文章
1637瀏覽量
48154 -
壁仞科技
+關(guān)注
關(guān)注
1文章
67瀏覽量
3121 -
大模型
+關(guān)注
關(guān)注
2文章
3086瀏覽量
3972 -
通義千問
+關(guān)注
關(guān)注
1文章
36瀏覽量
427
原文標(biāo)題:即刻適配!壁仞科技完成Qwen3全系列模型支持
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Intel OpenVINO? Day0 實現(xiàn)阿里通義 Qwen3 快速部署

評論