商汤开源多模态自主推理模型SenseNova-MARS，多项基准测试超越Gemini-3-Pro与GPT-5.2

推荐 2026-01-30 08:57

字号

SmartHey1月30日消息：商汤科技正式开源多模态自主推理模型 SenseNova-MARS，提供8B与32B双版本。该模型在多模态搜索与推理核心基准测试中取得69.74分，领先于Gemini-3-Pro（69.06分）和GPT-5.2（67.64分）。

SenseNova-MARS是业界首个支持动态视觉推理与图文搜索深度融合的Agentic视觉语言模型（Agentic VLM）。它具备自主规划任务步骤、调用外部工具的能力，显著提升复杂场景下的端到端执行效率，推动AI从‘理解’迈向真正可落地的‘行动智能’。

在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等多项权威基准测试中，SenseNova-MARS不仅刷新所有开源模型的SOTA纪录，更在搜索推理与视觉理解两大关键维度全面超越Gemini-3.0-Pro、GPT-5.2等主流闭源模型，展现出领先的多模态智能体能力。