谷歌I/O 2026重磅发布：Gemini 3.5 Flash、Omni模型、Antigravity 2.0与个人智能体Gemini Spark全面亮相

推荐 2026-05-20 08:18

字号

SmartHey5月20日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式推出涵盖基础模型、硬件设施、开发者平台与终端体验的全栈式AI新品矩阵。以下是 Google CEO Sundar Pichai 在 Google I/O 2026 大会上的核心演讲内容精编，已整合舞台实况发布的关键信息。

过去一年，我们持续推进AI技术从实验室走向真实场景。用户不再满足于‘能用’，而是期待AI真正解决实际问题——备考、创作、编程、规划日程、理解长视频……这些日常需求，正成为衡量AI进步最有力的标尺。今天发布的每一项产品与能力，都源于这一出发点。

值此‘AI优先’战略实施十周年之际，我们更坚定地践行全栈式创新路径：自研芯片（TPU）、安全底层架构、世界级基础模型（Gemini系列）、以及覆盖全球数十亿用户的终端产品与平台。这种垂直整合，使我们得以快速迭代、深度优化，并将技术红利高效转化为用户体验升级。

现实印证了这条路径的价值：学生用 Gemini app 高效复习；音乐人借 Lyria 生成旋律灵感；艺术家通过 Veo 实现视觉构想；开发者借助 AI 编写、调试并部署代码——AI 正在成为每个人的‘数字协作者’。

全栈式AI的规模化落地

衡量AI渗透深度，一个关键指标是 token 处理量——它代表模型实际解决的问题数。两年前，我们每月处理约 9.7 万亿 token；去年 I/O 达到 480 万亿；而今天，这一数字跃升至 **3200 万亿/月**，同比增长 7 倍。

这一增长背后，是生态的蓬勃扩张：

每月超 850 万名开发者 使用我们的模型构建新应用；
模型 API 当前每分钟处理约 190 亿 token；
过去12个月，超 375 家 Google Cloud 企业客户 单独处理 token 超过 1 万亿，印证AI已成为核心生产力引擎。

产品增长：从功能升级到体验重构

目前，Google 已有 13 款产品用户超 10 亿，其中 5 款突破 30 亿。Gemini 是驱动这一增长的核心智能引擎。

搜索仍是AI普惠的起点。AI 概览（AI Overviews）月活用户已超 25 亿；而搜索AI模式（AI Mode）上线一年即达 10 亿月活，正重塑人机交互范式——搜索不再是单次问答，而是一场持续、深入、可追溯的对话。

Gemini app 月活用户从去年 I/O 的 4 亿跃升至 9 亿，年增长超一倍；用户日均请求量提升逾 7 倍。新增的 Personal Intelligence 功能让响应更贴合个体习惯；Nano Banana 图像模型累计生成图像超 500 亿张，成为创造力释放的标志性载体。

自然对话：让AI真正‘听懂’你

我们正将自然语言交互能力扩展至更多场景：

Ask YouTube
面对海量视频，用户常困于‘找不到答案的入口’。Ask YouTube 重构体验：AI 不仅推荐最相关视频，更能精准定位并跳转至视频中解答问题的核心片段。该功能已启动小范围测试，计划今夏在美国全面上线。

语音驱动的 Docs Live
想法出口即成文档。Docs Live 允许用户以口语描述需求，Gemini 自动完成结构化撰写、润色与排版。未来，语音将延伸至 Gmail 和 Keep。该功能将于今夏向订阅用户开放。

基础设施：为智能体时代夯实根基

支撑海量创新，需要前所未有的算力投入。2022 年资本支出为 310 亿美元，2026 年预计达约 1800 亿美元，其中自研芯片是重中之重。

第八代 TPU 正式发布，首次采用双芯设计：
TPU 8t 专注大规模训练，原始算力近上代 3 倍；依托 JAX 与 Pathways 框架，训练任务可跨全球数据中心协同调度，实现百万级 TPU 规模集群训练，大幅缩短大模型开发周期。
TPU 8i 专为推理优化，兼顾极致速度与能效——每瓦特性能提升达 2 倍，延续谷歌对‘快即正义’的工程信仰。

Gemini Omni：跨模态智能新范式

Gemini Omni 是首个支持‘任意输入→任意输出’的统一模型。首发能力为视频生成，并将逐步拓展至图像与文本。其核心突破在于深度融合 Gemini 的世界理解能力与生成式媒体模型，实现从文本预测到物理世界模拟的跨越。

首秀模型 Gemini Omni Flash 即日起上线 Gemini app、Google Flow 与 YouTube Shorts；API 将于数周内向开发者与企业全面开放。

SynthID 升级：共建可信AI生态

为应对深度伪造挑战，SynthID 水印技术已为超 1000 亿张图像/视频 及 6 万小时音频 加密标识。如今，内容凭证验证（Content Credentials）功能将直接集成至 Google 搜索与 Chrome 浏览器，帮助用户一键识别内容来源与编辑痕迹。

开放协作至关重要。继 NVIDIA 后，OpenAI、Kakao、Eleven Labs 今日宣布加入 SynthID 标准联盟，共筑AI时代的内容信任基石。

Gemini 3.5 Flash：速度与智能的新标杆

继 Gemini 3 系列广受开发者欢迎后，我们推出全新一代主力模型：Gemini 3.5 Flash——首款融合顶尖智能与强大行动力的模型。

编程能力飞跃，GDPVal 等现实任务评测大幅领先；
推理速度达同类前沿模型的 4 倍（token/s），且综合性能稳居右上象限；
价格不足竞品一半，企业若将 80% 日常负载迁移至此，年均可节省超 10 亿美元；
已在 Google 内部驱动每日超 3 万亿 token 处理，形成强大反馈闭环。

即日起，Gemini 3.5 Flash 全面开放于所有产品及 API。下一代旗舰 Gemini 3.5 Pro 已在内部部署，预计下月正式发布。

Antigravity 2.0：智能体开发的操作系统

Antigravity 已进化为管理自主 AI 智能体集群的综合平台。2.0 版本推出独立桌面应用，作为智能体交互中枢，支持用户协调多个智能体协同执行复杂任务。内置优化版 Flash 响应速度达其他前沿模型的 12 倍，即日起开放体验。

Gemini Spark：你的专属数字协作者

这是首款面向普通用户的个人 AI 智能体，深度集成于 Gemini app：

运行于 Google Cloud 专属虚拟机，提供 24/7 全天候服务；
由 Gemini 3.5 与 Antigravity 驱动，可自主执行多步骤、长周期任务；
原生支持 Google 生态工具，数周内将通过 MCP 接入第三方服务；
交互方式多样：Gemini app 内直达、邮件/聊天软件接入、Android Halo UI 实时追踪、Chrome 浏览器内置助手；
本周起向可信测试者推送，下周起向美国 Google AI Ultra 订阅用户开放 Beta。

智能体时代的搜索：从信息检索到主动服务

今日起，Google 搜索引入信息智能体（Information Agents）：可设置为后台长期运行，主动发现、整合并推送关键信息，甚至协助执行操作。该功能今夏率先面向 Google AI Pro/Ultra 用户开放。

搜索还将具备生成式UI能力：基于 Gemini 3.5 Flash 与 Antigravity，动态生成定制化布局与交互效果，今夏向所有用户免费开放；针对长周期任务，可创建持久化仪表板，成为用户专属的‘迷你应用’，未来数月将支持用户在搜索中自主构建。

更多智能体新品速览

Daily Brief：Gemini app 内置智能体，自动分析邮箱、日历、待办事项，生成带优先级排序与行动建议的晨间简报；
Google Flow：全新通用型智能体，支持复杂任务推理与规划，内置‘氛围编程（Vibe code）’，可快速定制视频特效、手绘动画等创意工具；
Google Pics：基于 Nano Banana 的新一代AI图像创作与编辑工具，将画面元素视为独立可交互对象，实现像素级精细控制；即日起开放可信测试，今夏晚些时候面向 Workspace Pro/Ultra 用户上线；
智能眼镜进展：音频眼镜（实时语音协助）与显示眼镜（情境信息即时呈现）双线推进，音频眼镜将于今秋上市；
Gemini for Science：汇聚 Deep Think、Deep Research 等能力，无缝连接全球 30+ 生命科学数据库；Science Skills 已上线 GitHub 与 Antigravity，Labs 体验申请即刻开启。

从 TPU 8i 的底层算力，到 Gemini 3.5 的模型突破，再到 Antigravity 与 Spark 构建的智能体生态——我们确信：Gemini 智能体时代已然开启。

这不仅是技术的演进，更是我们践行‘整合信息，使人受益’使命的全新篇章。我们期待，这些能力能让技术更平实、好用，真正赋能全球每一个人。”

谷歌I/O 2026重磅发布：Gemini 3.5 Flash、Omni模型、Antigravity 2.0与个人智能体Gemini Spark全面亮相

猜你喜欢