谷歌I/O 2026正式发布Gemini Omni:全能多模态大模型,同步推出科研版与Omni Flash
SmartHey5月20日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。

诺贝尔奖获得者、Google DeepMind 负责人德米斯·哈萨比斯(Demis Hassabis)表示,Gemini Omni 是 Gemini 系列迄今最全面、最强大的统一多模态模型。‘Omni’象征‘全能’,该模型在理解与生成文本、图像、视频、音频等多类型内容时,展现出高度连贯性、上下文深度与跨模态推理能力。
Gemini Omni 支持‘任意输入→任意输出’的灵活交互范式,尤其强化了对话式内容编辑功能——用户仅需自然语言指令,即可实时修改视频中的人物形象、场景背景、光照风格等视觉元素。
与此同时,谷歌宣布推出面向科研工作者的专用版本:Gemini for Science。
Gemini for Science 具备论文动态追踪、研究目标代码化转化、科学假设生成等核心能力,旨在加速从理论构想到实验验证的全流程。
此外,谷歌还首发 Gemini Omni 家族首个轻量高效版本——Gemini Omni Flash,即日起已上线 Gemini App、Google Flow 及 YouTube Shorts,提供低延迟响应体验;面向开发者的 API 接口服务也将在后续阶段逐步开放。
