商汤开源多模态自主推理模型SenseNova-MARS,多项基准测试超越Gemini-3-Pro与GPT-5.2
SmartHey1月30日消息:商汤科技正式开源多模态自主推理模型 SenseNova-MARS,提供8B与32B双版本。该模型在多模态搜索与推理核心基准测试中取得69.74分,领先于Gemini-3-Pro(69.06分)和GPT-5.2(67.64分)。
SenseNova-MARS是业界首个支持动态视觉推理与图文搜索深度融合的Agentic视觉语言模型(Agentic VLM)。它具备自主规划任务步骤、调用外部工具的能力,显著提升复杂场景下的端到端执行效率,推动AI从‘理解’迈向真正可落地的‘行动智能’。
在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等多项权威基准测试中,SenseNova-MARS不仅刷新所有开源模型的SOTA纪录,更在搜索推理与视觉理解两大关键维度全面超越Gemini-3.0-Pro、GPT-5.2等主流闭源模型,展现出领先的多模态智能体能力。
