腾讯发布操作系统级AI助手Marvis：6大Agent协同，实现跨端文件管理与远程操控

Marvis能做什么？

在发布会前的媒体沟通会上，腾讯产品团队现场演示了Marvis的核心能力。初看界面，它与常见AI助手相似；但深入交互后，差异立现——Marvis解决的不是“如何提问”，而是“如何成事”。

现实中，用户使用电脑的高频需求是“找文件”“装软件”“清垃圾”“查配置”“远程帮家人操作设备”，本质是结果导向，而非对话本身。Marvis正为此而生：

例如，只需一句指令：“帮我找出上个月所有发票，按日期排序整理成Excel表格”，Marvis即刻启动协同机制，屏幕右侧实时呈现六大Agent分工状态：

过去需半小时手动完成的任务，如今语音下达指令即可静待结果。更关键的是，该能力支持跨端延伸——出差途中用手机App向家中电脑下发指令，Marvis即刻响应执行，大幅提升移动办公实用性。

02.

这款产品的研发主体来自腾讯应用宝团队。不同于“先堆模型再找场景”的路径，Marvis采用“自下而上”的构建逻辑：从真实用户行为、设备交互、文件结构、应用生态出发，反向定义AI服务边界。

团队自2023年起持续投入文件解析、格式转换、跨端通信等底层能力建设，夯实技术地基后，再叠加Agent框架与系统级集成能力。

对比腾讯另一款AI产品WorkBuddy（聚焦文档生成、批量办公自动化），Marvis更强调终端主权——它不依赖云端SaaS平台，而是扎根于个人设备的文件系统、应用层与算力资源，主打跨端文件治理与系统AI化。

这一能力源于应用宝14年应用分发经验与4年跨端生态积累。凭借与芯片厂商、OS厂商的深度合作，Marvis实现了操作系统层级的软硬协同：

与Intel联合优化端侧AI推理：基于OpenVINO框架对中小模型进行芯片级加速，整体性能提升超20%，在AIPC设备上GPU/NPU推理速度达CPU的2–10倍；
与微软共建Windows端侧AI基础设施：依托Microsoft Foundry on Windows平台及WinML推理框架，实现大模型在本地NPU/GPU/CPU的混合调度与低功耗运行；
通过MCP on Windows提供的ODR（本地设备代理注册表），Marvis获得系统级文件MCP服务权限，首次实现“在任意应用内，仅凭自然语言Prompt即可直接读写、查询、理解本地文件”——这是传统应用层AI无法企及的能力。

目前Marvis已开放官网下载，全面支持Windows、macOS、iOS与Android四端，同一账号数据互通，并为每位用户提供每日1000万免费Token额度。团队坦言，Agent类应用的Token消耗显著高于对话型AI，长期完全免费不可持续，建议早期用户尽快体验。

此外，产品提供双模式运行：

效率模式：端云协同，本地完成识别、索引与预处理，复杂推理与长程规划交由云端大模型处理；
隐私模式：纯本地推理，全部数据不出设备，适用于对隐私敏感的场景（如财务文档、医疗资料）。该模式虽在长文本理解与复杂任务规划上存在能力上限，但安全性和可控性更强。

针对近期行业频发的AI误操作风险，Marvis内置L2级安全防护机制：凡涉及资金交易、系统核心配置变更、批量文件删除等高危操作，系统强制触发“硬确认（Hard Confirm）”，必须用户主动点击授权方可执行，杜绝AI越权行为。

过去AI竞赛聚焦于大模型参数、上下文长度与推理速度，Agent常被视作功能外挂或交互皮肤。而真正的下半场，应是AI与硬件、系统、数据的深度融合——唯有如此，才能释放效率跃迁的真实价值。

腾讯Marvis迈出的关键一步，正是将AI从“云端对话者”转变为“本地协作者”。它不替代人类决策，却极大压缩执行路径；不承诺万能，却让每个普通用户都拥有可调度的AI生产力团队。

方向是否正确？答案不在实验室里，而在千万用户的每一次点击与反馈中。