阿里開源三款中型千問3.5新模型,可直接部署於消費級顯卡

robot
摘要生成中

新京報貝殼財經訊(記者羅亦丹)2月25日,繼除夕開源Qwen3.5-397B-A17B之後,阿里繼續開源千問3.5系列模型。本次開源三款中等規模的新模型,包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。基於架構創新和訓練突破,此次開源的三款千問3.5模型均創下中等尺寸模型的性能新高,超越了更大尺寸的上代旗艦模型Qwen3-235B-A22B和Qwen3-VL,多榜單表現均明顯優於GPT-5 mini。

值得注意的是,千問3.5新模型甚至可直接部署於消費級顯卡,對開發者極為友好。目前,基於Qwen3.5-35B-A3B的托管模型Qwen3.5-Flash已上線阿里雲百煉,每百萬Token輸入低至0.2元。千問3.5模型採用混合注意力機制,結合高稀疏的MoE架構創新,並基於更大規模的文本和視覺混合Token上訓練,新模型以更小的總參數和激活參數量,實現性能提升。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言