谷歌升级Gemini 3 Deep Think推理模式,面向科研与工程场景开放API早期访问
SmartHey2月14日消息,谷歌北京时间13日晚间宣布对Gemini 3 Deep Think进行重大升级,推出专为科学、研究与工程场景优化的‘推理模式’,旨在推动人工智能在真实复杂问题解决能力上的前沿突破。
据悉,新版Deep Think由谷歌工程师联合多领域科学家与研究人员协同开发,聚焦科研实践中典型挑战:问题边界模糊、答案不唯一、数据噪声大或严重缺失等现实难题。
此次升级显著拓展了Deep Think的可用范围。自当地时间2月12日起,更新后的Deep Think已面向Google AI Ultra订阅用户,在Gemini官方应用中全面开放。
更关键的是,谷歌首次通过Gemini API向部分科研人员、工程师及企业开放Deep Think能力,启动‘早期访问计划’,并同步开通申请通道,广泛招募具备实际应用场景的先行用户。
在核心能力方面,新版Deep Think在数学推演、算法设计与编程等高阶推理任务上实现持续跃升:在无外部工具辅助下,于终极人类考试(Humanity's Last Exam)中取得48.4%准确率;在ARC-AGI-2基准测试中达84.6%,获ARC Prize Foundation官方验证;在Codeforces竞赛编程评测中获得3455 Elo分;并在2025年国际数学奥林匹克竞赛(IMO 2025)模拟评估中达到金牌水平。

除数理逻辑能力外,Deep Think在化学、物理等基础科学领域亦展现显著提升。谷歌披露,该模型在2025年国际物理奥林匹克与国际化学奥林匹克笔试环节均达成金牌级表现,并在理论物理专项评测CMT-Benchmark中取得50.5%的得分。

谷歌强调,Deep Think的核心价值不仅在于刷新基准测试纪录,更在于赋能真实科研与工程落地——例如辅助科学家解析高维实验数据、支持工程师构建高保真物理系统仿真代码。未来,谷歌将持续把Deep Think部署至科研一线与产业现场最需要的环节,而本次通过Gemini API开放早期访问,正是这一战略的关键起点。

