智谱发布开源大模型GLM-5:Coding与Agent能力达开源SOTA,对齐Claude Opus 4.5

SmartHey2月12日消息,智谱正式上线并开源新一代大语言模型 GLM-5。该模型在代码生成(Coding)与智能体(Agent)任务能力上实现重大突破,斩获多项开源模型SOTA(State-of-the-Art)成绩,在真实编程场景中的使用体验已逼近 Claude Opus 4.5,尤其擅长复杂系统工程构建与长周期、多步骤的Agent任务执行。

在全球权威AI评估机构 Artificial Analysis 的最新榜单中,GLM-5 综合排名全球第四、开源模型第一。

更大基座,更强智能

GLM-5 全新升级的基座模型,为大模型能力从“写单行代码”迈向“交付完整工程”提供了坚实支撑:

  • 参数与数据规模跃升:激活参数量由32B提升至40B,总参数达744B(原为355B);预训练数据量从23TB增至28.5TB,显著增强通用认知与推理能力。
  • 异步强化学习框架“Slime”:支持超大规模模型的高效强化学习训练,首创异步智能体强化学习算法,使模型可在长程交互中持续自主优化,充分释放预训练潜力。
  • 集成DeepSeek稀疏注意力机制:在保持长文本建模效果无损的前提下,大幅降低显存占用与推理延迟,显著提升Token处理效率与部署性价比。

Coding能力:全面对标Claude Opus 4.5

GLM-5 在主流编程基准测试中刷新开源模型纪录:SWE-bench-Verified 得分77.8、Terminal Bench 2.0 得分56.2,双双位居开源第一,性能超越 Gemini 3 Pro。

2026年的大模型已进入“交付即价值”阶段——不止于生成代码片段,更要端到端完成可上线、可运维的生产级系统。GLM-5 定位为“AI系统架构师”,专为稳定交付真实业务结果而设计。

在内部Claude Code评测集上,GLM-5在前端开发、后端服务重构、长程Agentic规划与深度调试等任务中,相较前代GLM-4.7平均提升超20%,人工干预极少即可独立完成系统级工程任务,实际使用体验高度接近Claude Opus 4.5。

Agent能力:开源SOTA级长程任务执行者

GLM-5 在智能体核心能力维度全面领跑开源阵营:在 BrowseComp(联网检索与语义理解)、MCP-Atlas(多工具调用与流程编排)及 τ²-Bench(高复杂度多工具协同规划)三大权威评测中均位列开源第一。

在极具挑战性的长期经营模拟评测 Vending Bench 2 中,GLM-5以4432美元最终账户余额斩获开源模型榜首。该评测要求模型在一年周期内自主运营虚拟自动售货机业务,涵盖市场分析、库存调度、定价策略与财务优化等全链路决策,其表现已逼近Claude Opus 4.5,展现出卓越的长期目标一致性、资源统筹与跨周期规划能力。

这些能力共同定义了“Agentic Engineering”新范式:模型不仅是工具使用者,更是具备目标维持、资源管理、依赖协调与容错恢复能力的“可信赖工程主体”,是真正面向生产环境的Agentic Ready基座。

全面适配国产芯片,支撑线上高并发推理

随着GLM Coding Plan全球需求激增,智谱已启动服务限流保障。本次GLM-5规模化上线,依托国产算力生态实现稳定高效支撑。

目前,GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产AI加速芯片的深度推理适配。通过定制化算子融合与硬件级加速优化,已在国产集群上达成高吞吐、低延迟、高可用的工业级推理性能。

Agentic Engineering四大典型应用场景

场景一:端到端可交付应用开发

自OpenRouter平台匿名(Pony)版本上线以来,开发者已基于GLM-5成功构建多款可运行、可交互、可上架的真实应用,包括横版解谜游戏、Agent驱动的虚拟交互世界、论文版“抖音”等内容平台。相关案例均已开放下载或进入应用商店审核流程,详情请访问GLM-5官方案例库(showcase.z.ai),直观展现其端到端交付生产级产品的工程实力。

场景二:通用智能Agent助手

凭借领先的多工具调用与长程任务编排能力,GLM-5已成为构建通用型AI助手的理想基座。

在 OpenClaw 框架中接入GLM-5,用户可快速获得一位7×24小时在线的“AI实习生”,支持网页搜索、资讯聚合、社交媒体发布、自动化编程等复合任务。智谱同步推出 AutoGLM 版 OpenClaw,官网一键完成飞书机器人集成,将部署耗时从数小时压缩至分钟级,助力企业极速落地专属智能办公助理。

场景三:Z Code全流程编程引擎

当模型能力覆盖完整开发闭环,编程工具也需随之重构。为此,智谱推出全新编程范式 Z Code:用户仅需清晰描述需求,GLM-5即自动拆解任务,调度多个专业化智能体并行完成编码、命令执行、自动化调试、实时预览与版本提交等全流程操作。

借助Z Code,用户甚至可通过手机远程指挥桌面端Agent,高效解决传统需数小时的人工工程任务。

值得一提的是,Z Code整套系统亦由GLM系列模型全程参与研发完成,实现“用AI造AI”的正向飞轮。

场景四:办公文档直出能力

依托增强的系统工程与长程Agent能力,GLM-5支持将自然语言指令或原始素材直接生成结构化办公文档,输出格式涵盖 .docx、.pdf 和 .xlsx。

在 Z.ai 与智谱清言平台,用户可一键生成产品需求文档(PRD)、教学教案、标准化试卷、财务分析报表、业务流程图、餐厅菜单等专业文档,大幅提升知识工作者内容生产力。

开源与接入方式

即日起,GLM-5 已在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License,开放商用与研究使用。

GLM-5 已正式纳入 Max 用户订阅套餐;Pro 用户将于5日内全面支持。后续智谱将持续扩大覆盖范围,让更多开发者便捷体验这一开源旗舰模型。GLM Coding Plan 同步兼容 Claude Code、OpenCode 等主流开发环境。

GLM Coding Plan 进一步升级 Agentic Engineering 支持能力:

  • 官方深度适配 OpenClaw:提供极简配置流程,开箱即用启动智能体工作流;
  • Pro / Max 用户专享 AutoGLM-OpenClaw:限量赠送云端AI助手飞书集成服务,赋能办公场景长周期任务自动化;
  • 新增 GLM in Excel 插件权益:原生适配Excel的AI侧边栏插件,支持自然语言交互式数据分析与表格处理(Beta阶段仅Max用户可通过套餐抵扣开通)。