【ＡＩ】阿里發布Ｑｗｅｎ３－Ｎｅｘｔ新模型，推理效率提升１…

by · 12 9 月, 2025

《經濟通通訊社１２日專訊》阿里發布了下一代基礎模型架構Ｑｗｅｎ３－Ｎｅｘｔ，並開
源了基於該架構的Ｑｗｅｎ３－Ｎｅｘｔ－８０Ｂ－Ａ３Ｂ系列模型。新模型擁有８００億參數
，激活參數僅３０億，訓練成本僅為Ｑｗｅｎ３－３２Ｂ的十分之一，對於超過３２，０００個
標記的長文本推理，新模型與之前版本相比提供了１０倍以上的更高吞吐量，推理效率大幅提升
。

這款新模型具有混合注意力機制、高度稀疏的專