谷歌I/O 2026正式发布Gemini Omni：全能多模态大模型，同步推出科研版与Omni Flash

推荐 2026-05-20 03:47

字号

SmartHey5月20日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。

诺贝尔奖获得者、Google DeepMind 负责人德米斯·哈萨比斯（Demis Hassabis）表示，Gemini Omni 是 Gemini 系列迄今最全面、最强大的统一多模态模型。‘Omni’象征‘全能’，该模型在理解与生成文本、图像、视频、音频等多类型内容时，展现出高度连贯性、上下文深度与跨模态推理能力。

Gemini Omni 支持‘任意输入→任意输出’的灵活交互范式，尤其强化了对话式内容编辑功能——用户仅需自然语言指令，即可实时修改视频中的人物形象、场景背景、光照风格等视觉元素。

与此同时，谷歌宣布推出面向科研工作者的专用版本：Gemini for Science。

Gemini for Science 具备论文动态追踪、研究目标代码化转化、科学假设生成等核心能力，旨在加速从理论构想到实验验证的全流程。

此外，谷歌还首发 Gemini Omni 家族首个轻量高效版本——Gemini Omni Flash，即日起已上线 Gemini App、Google Flow 及 YouTube Shorts，提供低延迟响应体验；面向开发者的 API 接口服务也将在后续阶段逐步开放。