【AI】阿里發布Qwen3-Next新模型,推理效率提升1…
《經濟通通訊社12日專訊》阿里發布了下一代基礎模型架構Qwen3-Next,並開
源了基於該架構的Qwen3-Next-80B-A3B系列模型。新模型擁有800億參數
,激活參數僅30億,訓練成本僅為Qwen3-32B的十分之一,對於超過32,000個
標記的長文本推理,新模型與之前版本相比提供了10倍以上的更高吞吐量,推理效率大幅提升
。
這款新模型具有混合注意力機制、高度稀疏的專
《經濟通通訊社12日專訊》阿里發布了下一代基礎模型架構Qwen3-Next,並開
源了基於該架構的Qwen3-Next-80B-A3B系列模型。新模型擁有800億參數
,激活參數僅30億,訓練成本僅為Qwen3-32B的十分之一,對於超過32,000個
標記的長文本推理,新模型與之前版本相比提供了10倍以上的更高吞吐量,推理效率大幅提升
。
這款新模型具有混合注意力機制、高度稀疏的專