阿里开源千问3.5三款中等规模大模型,摩尔线程全栈适配MTT S5000 GPU

SmartHey2月26日消息,继开源超大规模模型Qwen3.5-397B-A17B之后,阿里巴巴再度升级千问开源生态,正式发布Qwen3.5系列三款中等参数量模型:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B与Qwen3.5-27B,兼顾性能、效率与部署灵活性。

摩尔线程迅速响应,宣布已完成这三款新模型在旗舰级AI训推一体全功能GPU——MTT S5000上的全栈适配与深度优化。

原生MUSA C支持:开发者可直接调用MUSA C接口进行底层内核开发,显著降低从CUDA生态迁移至国产GPU平台的技术门槛;

深度兼容Triton-MUSA:支持使用标准Triton语法编写高性能算子,并通过Triton-MUSA编译后端,一键部署至摩尔线程全功能GPU,实现开发体验无缝衔接。

在底层技术层面,针对Qwen3.5多模态模型所采用的混合注意力机制(Hybrid Attention),摩尔线程完成针对性原生优化:依托自研muDNN高性能计算库与开源MATE算子库,对长序列建模中的关键计算路径进行加速重构,成功在MTT S5000上达成低延迟、高吞吐的稳定推理表现。