月之暗面发布开源大模型Kimi K2.6:支持13小时连续编码、300子Agent集群与端到端网页/PPT生成

SmartHey4月21日消息,月之暗面于20日晚间正式发布并开源其最新大模型——Kimi K2.6。该模型在代码生成能力、长程任务执行稳定性及多Agent协同调度方面实现系统性跃升,即日起全面开放使用,用户可通过官网(kimi.com)、最新版Kimi App、Kimi API及Kimi Code编程助手直接调用。

据官方披露,Kimi K2.6在多项权威基准测试中表现突出:在博士级综合能力评估“终极人类考试”(Humanity's Last Exam)全卷、聚焦真实软件工程能力的SWE-Bench Pro,以及专为Agent设计的深度检索基准DeepSearchQA中,成绩均达行业领先水平,整体表现持平或优于GPT-5.4、Claude Opus 4.6与Gemini 3.1 Pro等主流闭源模型。

作为月之暗面迄今最强的代码专用模型,K2.6显著强化了长程编码稳定性与系统级开发能力。实测显示,其可连续运行超13小时,完成超过4000行代码的编写与重构,支撑复杂软件系统的全流程开发与性能优化。

依托代码与视觉理解能力的深度融合,K2.6已能自主交付具备专业设计水准的Web应用。在月之暗面自研代码评测基准Kimi Code Bench中,其综合得分较上一代K2.5提升约20%。

典型案例表明,K2.6可在Mac本地环境自主完成Qwen3.5-0.8B模型的下载、部署与推理优化:全程使用Zig语言实现底层逻辑,历经14轮迭代、4000余次工具调用、超12小时不间断运行,最终将吞吐量从15 tokens/s提升至193 tokens/s,推理速度超越LM Studio达20%。

另一案例中,K2.6对拥有8年历史、接近性能瓶颈的开源金融撮合引擎exchange-core实施深度重构:连续作业13小时,调用工具逾1000次,精准修改4000+行代码,共尝试12套优化策略,使中位吞吐量由0.43 MT/s跃升至1.24 MT/s(+185%),峰值吞吐量由1.23 MT/s飙升至2.86 MT/s(+133%)。

在代码驱动设计方面,K2.6的Agent模式可生成兼具创意性与视觉统一性的落地页。它能熟练调度图像与视频生成工具,构建高辨识度首屏、设计交互动效,并支持滚动触发动画等进阶体验。

值得注意的是,该能力不仅覆盖前端呈现,亦延伸至基础后端功能——例如在网页中嵌入结构化表单、实现信息自动采集与存储。

为科学衡量设计能力,月之暗面同步推出前端开发专项评测基准Kimi Design Bench,涵盖视觉输入理解、落地页构建、全栈应用开发及通用Web开发四大维度。对比Google AI Studio中的Gemini 3模型,基于K2.6构建的Agent在各项指标中均展现出明显优势。

K2.6的Agent集群能力迎来重大升级:支持动态拆解复杂任务、实时生成专业化子Agent并行处理,最高可调度300个子Agent,协同完成多达4000个协作步骤。相较K2.5,任务完成率与交付质量显著提升。集群可有机整合搜索、深度研究、文档解析与长文创作等能力,在单次运行中独立产出网页、PPT、表格等多形态成果,实现真正端到端交付。

例如,该集群曾针对全球100家半导体上市公司,自主设计并执行5套量化分析策略,将麦肯锡风格的PPT逻辑沉淀为可复用技能,最终交付建模表格与全套汇报演示文档。

又如,其成功将一篇含大量天文图像与数据的天体物理论文转化为可复用学术技能:完整提取推理链与可视化范式,生成40页、7000字的研究综述,配套包含2万余条记录的结构化数据集及14张专业级天文图表。

K2.6还大幅增强Agent的自主执行韧性,尤其在与OpenClaw、Hermes Agent等主动式框架协同时表现卓越——这类场景要求AI跨应用实现7×24小时无间断运行。

月之暗面RL基础设施团队基于K2.6构建的运维Agent,已实现连续5天全自动监控、告警响应与故障修复,充分验证其长期上下文保持、多线程任务调度及“从问题发现到闭环解决”的全流程执行能力。

内部Claw Bench评测显示,K2.6在编程任务、IM生态集成、信息检索与分析、定时任务管理、记忆调用五大维度综合性能较K2.5提升10%,在需长时间自治、零人工干预的工作流中优势尤为突出。

借助更强的代码与多模态理解能力,K2.6首次支持“技能(Skill)”的创建与调用。平台已预置上百个官方认证技能,涵盖投研场景:用户可一键生成专业排版的A股、港股、美股公司一页纸摘要或深度投资研报。

在Kimi Agent模式下,用户输入斜杠“/”即可快速启动技能创建或调用;同时上线“Office文档转技能”功能——上传高质量Word/PPT/Excel文件后,模型将自动解析其结构逻辑与视觉风格基因,生成专属、可复用的文档生成技能。

月之暗面同步宣布启动“Claw群组”小范围公测。该架构旨在构建人机共生的协作网络:用户可接入任意设备、任意厂商、任意模型的全天候Agent(首批兼容OpenClaw,后续将扩展支持Hermes Agent等框架),每个Agent均可携带专属工具包、技能库与持久化记忆上下文。

在Claw群组中,K2.6担任智能协调者角色,依据各Agent的技能画像与可用工具动态分配任务;当某Agent出现卡顿或异常中断时,协调者将实时检测并自动重调度任务或生成替代子任务。首批内测邀请正陆续发放中。

Kimi K2.6现已向所有用户免费开放——包括个人免费用户、付费订阅用户、Kimi Code用户及企业API客户。开发者只需在Kimi API请求中指定模型名称为kimi-k2.6,即可立即启用。

为庆祝K2.6 API正式上线,Kimi开放平台同步推出限时充赠活动,最高享30%额度加赠。此外,Kimi K2.6官方API已首发登陆腾讯云TokenHub等主流平台。月之暗面建议开发者优先调用官方API以复现基准评测结果;如需选用第三方服务商,可通过Kimi模型供应商验证服务(Kimi Vendor Verifier, KVV)筛选精度更优的合规接口。