腾讯发布操作系统级AI助手Marvis:6大Agent协同,实现跨端文件管理与远程操控

撰文 | 李信马
题图 | Marvis
了不起的智能体
发现和介绍那些正在改变世界的Agent,这里有现场、有对话,还有没被写进新闻的细节。
这一次,腾讯将AI助手深度集成至操作系统底层,推出全新产品Marvis(马维斯)。
SmartHey5月20日消息,腾讯正式上线Marvis——一款定位于操作系统层级的AI助手。在AI助手产品泛滥的当下,Marvis并非嵌入App的聊天框,也非浏览器插件,而是真正“住进”你电脑系统的AI管家:它可访问本地文件、调度桌面应用、修改系统设置,甚至支持手机远程操控电脑执行任务。
其命名灵感源自钢铁侠的AI管家Jarvis,寓意同样强大而可靠:当你的电脑拥有Marvis,就像为日常数字生活装备了一套轻量级“机械战甲”。
一句话总结:装上Marvis,你拥有的不再是一个问答工具,而是一个全天候在线、多角色协同的AI办公团队。
01.
Marvis能做什么?
在发布会前的媒体沟通会上,腾讯产品团队现场演示了Marvis的核心能力。初看界面,它与常见AI助手相似;但深入交互后,差异立现——Marvis解决的不是“如何提问”,而是“如何成事”。

现实中,用户使用电脑的高频需求是“找文件”“装软件”“清垃圾”“查配置”“远程帮家人操作设备”,本质是结果导向,而非对话本身。Marvis正为此而生:
- 自动识别并分类相册图片,支持按人像、场景、节日、地点等维度智能归档;
- 深度调用Windows系统API,可检测硬件兼容性(如某游戏能否流畅运行)、优化开机项、清理冗余文件;
- 内置多模态本地模型,支持图文内容搜索、图片内文字提取,彻底告别“忘了文件名就找不到”的困扰;
- 预置6大专业化Agent,构成出厂即用的“AI协作团队”,无需用户手动搭建工作流。
例如,只需一句指令:“帮我找出上个月所有发票,按日期排序整理成Excel表格”,Marvis即刻启动协同机制,屏幕右侧实时呈现六大Agent分工状态:

- 主Agent:任务中枢,负责理解意图、拆解步骤、分配子任务、整合结果交付;
- File Agent:专注文件全生命周期管理,可识别发票类型、提取金额/日期/开票方等结构化信息;
- Computer Agent:系统级运维专家,覆盖硬件诊断、驱动管理、电源设置等底层操作;
- App Agent:桌面应用调度员,支持启动、切换、自动化操作.exe/.app程序;
- Browser Agent:网页交互引擎,可自动填写表单、抓取公开数据、完成跨站操作;
- Search Agent:聚合式搜索专家,融合本地索引与网络检索,提供带信源引用的答案。
过去需半小时手动完成的任务,如今语音下达指令即可静待结果。更关键的是,该能力支持跨端延伸——出差途中用手机App向家中电脑下发指令,Marvis即刻响应执行,大幅提升移动办公实用性。
02.
Marvis是怎样做出来的?
这款产品的研发主体来自腾讯应用宝团队。不同于“先堆模型再找场景”的路径,Marvis采用“自下而上”的构建逻辑:从真实用户行为、设备交互、文件结构、应用生态出发,反向定义AI服务边界。
团队自2023年起持续投入文件解析、格式转换、跨端通信等底层能力建设,夯实技术地基后,再叠加Agent框架与系统级集成能力。
对比腾讯另一款AI产品WorkBuddy(聚焦文档生成、批量办公自动化),Marvis更强调终端主权——它不依赖云端SaaS平台,而是扎根于个人设备的文件系统、应用层与算力资源,主打跨端文件治理与系统AI化。
这一能力源于应用宝14年应用分发经验与4年跨端生态积累。凭借与芯片厂商、OS厂商的深度合作,Marvis实现了操作系统层级的软硬协同:
- 与Intel联合优化端侧AI推理:基于OpenVINO框架对中小模型进行芯片级加速,整体性能提升超20%,在AIPC设备上GPU/NPU推理速度达CPU的2–10倍;
- 与微软共建Windows端侧AI基础设施:依托Microsoft Foundry on Windows平台及WinML推理框架,实现大模型在本地NPU/GPU/CPU的混合调度与低功耗运行;
- 通过MCP on Windows提供的ODR(本地设备代理注册表),Marvis获得系统级文件MCP服务权限,首次实现“在任意应用内,仅凭自然语言Prompt即可直接读写、查询、理解本地文件”——这是传统应用层AI无法企及的能力。

目前Marvis已开放官网下载,全面支持Windows、macOS、iOS与Android四端,同一账号数据互通,并为每位用户提供每日1000万免费Token额度。团队坦言,Agent类应用的Token消耗显著高于对话型AI,长期完全免费不可持续,建议早期用户尽快体验。
此外,产品提供双模式运行:
- 效率模式:端云协同,本地完成识别、索引与预处理,复杂推理与长程规划交由云端大模型处理;
- 隐私模式:纯本地推理,全部数据不出设备,适用于对隐私敏感的场景(如财务文档、医疗资料)。该模式虽在长文本理解与复杂任务规划上存在能力上限,但安全性和可控性更强。

针对近期行业频发的AI误操作风险,Marvis内置L2级安全防护机制:凡涉及资金交易、系统核心配置变更、批量文件删除等高危操作,系统强制触发“硬确认(Hard Confirm)”,必须用户主动点击授权方可执行,杜绝AI越权行为。
写在最后
过去AI竞赛聚焦于大模型参数、上下文长度与推理速度,Agent常被视作功能外挂或交互皮肤。而真正的下半场,应是AI与硬件、系统、数据的深度融合——唯有如此,才能释放效率跃迁的真实价值。
腾讯Marvis迈出的关键一步,正是将AI从“云端对话者”转变为“本地协作者”。它不替代人类决策,却极大压缩执行路径;不承诺万能,却让每个普通用户都拥有可调度的AI生产力团队。
方向是否正确?答案不在实验室里,而在千万用户的每一次点击与反馈中。
