谷歌I/O 2026重磅发布:Gemini 3.5 Flash、Omni模型、Antigravity 2.0与个人智能体Gemini Spark全面亮相
SmartHey5月20日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式推出涵盖基础模型、硬件设施、开发者平台与终端体验的全栈式AI新品矩阵。以下是 Google CEO Sundar Pichai 在 Google I/O 2026 大会上的核心演讲内容精编,已整合舞台实况发布的关键信息。

过去一年,我们持续推进AI技术从实验室走向真实场景。用户不再满足于‘能用’,而是期待AI真正解决实际问题——备考、创作、编程、规划日程、理解长视频……这些日常需求,正成为衡量AI进步最有力的标尺。今天发布的每一项产品与能力,都源于这一出发点。
值此‘AI优先’战略实施十周年之际,我们更坚定地践行全栈式创新路径:自研芯片(TPU)、安全底层架构、世界级基础模型(Gemini系列)、以及覆盖全球数十亿用户的终端产品与平台。这种垂直整合,使我们得以快速迭代、深度优化,并将技术红利高效转化为用户体验升级。
现实印证了这条路径的价值:学生用 Gemini app 高效复习;音乐人借 Lyria 生成旋律灵感;艺术家通过 Veo 实现视觉构想;开发者借助 AI 编写、调试并部署代码——AI 正在成为每个人的‘数字协作者’。
全栈式AI的规模化落地
衡量AI渗透深度,一个关键指标是 token 处理量——它代表模型实际解决的问题数。两年前,我们每月处理约 9.7 万亿 token;去年 I/O 达到 480 万亿;而今天,这一数字跃升至 **3200 万亿/月**,同比增长 7 倍。

这一增长背后,是生态的蓬勃扩张:
- 每月超 850 万名开发者 使用我们的模型构建新应用;
- 模型 API 当前每分钟处理约 190 亿 token;
- 过去12个月,超 375 家 Google Cloud 企业客户 单独处理 token 超过 1 万亿,印证AI已成为核心生产力引擎。
产品增长:从功能升级到体验重构
目前,Google 已有 13 款产品用户超 10 亿,其中 5 款突破 30 亿。Gemini 是驱动这一增长的核心智能引擎。
搜索仍是AI普惠的起点。AI 概览(AI Overviews)月活用户已超 25 亿;而搜索AI模式(AI Mode)上线一年即达 10 亿月活,正重塑人机交互范式——搜索不再是单次问答,而是一场持续、深入、可追溯的对话。
Gemini app 月活用户从去年 I/O 的 4 亿跃升至 9 亿,年增长超一倍;用户日均请求量提升逾 7 倍。新增的 Personal Intelligence 功能让响应更贴合个体习惯;Nano Banana 图像模型累计生成图像超 500 亿张,成为创造力释放的标志性载体。
自然对话:让AI真正‘听懂’你
我们正将自然语言交互能力扩展至更多场景:
Ask YouTube
面对海量视频,用户常困于‘找不到答案的入口’。Ask YouTube 重构体验:AI 不仅推荐最相关视频,更能精准定位并跳转至视频中解答问题的核心片段。该功能已启动小范围测试,计划今夏在美国全面上线。

语音驱动的 Docs Live
想法出口即成文档。Docs Live 允许用户以口语描述需求,Gemini 自动完成结构化撰写、润色与排版。未来,语音将延伸至 Gmail 和 Keep。该功能将于今夏向订阅用户开放。
基础设施:为智能体时代夯实根基
支撑海量创新,需要前所未有的算力投入。2022 年资本支出为 310 亿美元,2026 年预计达约 1800 亿美元,其中自研芯片是重中之重。
第八代 TPU 正式发布,首次采用双芯设计:
TPU 8t 专注大规模训练,原始算力近上代 3 倍;依托 JAX 与 Pathways 框架,训练任务可跨全球数据中心协同调度,实现百万级 TPU 规模集群训练,大幅缩短大模型开发周期。
TPU 8i 专为推理优化,兼顾极致速度与能效——每瓦特性能提升达 2 倍,延续谷歌对‘快即正义’的工程信仰。
Gemini Omni:跨模态智能新范式
Gemini Omni 是首个支持‘任意输入→任意输出’的统一模型。首发能力为视频生成,并将逐步拓展至图像与文本。其核心突破在于深度融合 Gemini 的世界理解能力与生成式媒体模型,实现从文本预测到物理世界模拟的跨越。
首秀模型 Gemini Omni Flash 即日起上线 Gemini app、Google Flow 与 YouTube Shorts;API 将于数周内向开发者与企业全面开放。
SynthID 升级:共建可信AI生态
为应对深度伪造挑战,SynthID 水印技术已为超 1000 亿张图像/视频 及 6 万小时音频 加密标识。如今,内容凭证验证(Content Credentials)功能将直接集成至 Google 搜索与 Chrome 浏览器,帮助用户一键识别内容来源与编辑痕迹。
开放协作至关重要。继 NVIDIA 后,OpenAI、Kakao、Eleven Labs 今日宣布加入 SynthID 标准联盟,共筑AI时代的内容信任基石。
Gemini 3.5 Flash:速度与智能的新标杆
继 Gemini 3 系列广受开发者欢迎后,我们推出全新一代主力模型:Gemini 3.5 Flash——首款融合顶尖智能与强大行动力的模型。
- 编程能力飞跃,GDPVal 等现实任务评测大幅领先;
- 推理速度达同类前沿模型的 4 倍(token/s),且综合性能稳居右上象限;
- 价格不足竞品一半,企业若将 80% 日常负载迁移至此,年均可节省超 10 亿美元;
- 已在 Google 内部驱动每日超 3 万亿 token 处理,形成强大反馈闭环。
即日起,Gemini 3.5 Flash 全面开放于所有产品及 API。下一代旗舰 Gemini 3.5 Pro 已在内部部署,预计下月正式发布。

Antigravity 2.0:智能体开发的操作系统
Antigravity 已进化为管理自主 AI 智能体集群的综合平台。2.0 版本推出独立桌面应用,作为智能体交互中枢,支持用户协调多个智能体协同执行复杂任务。内置优化版 Flash 响应速度达其他前沿模型的 12 倍,即日起开放体验。
Gemini Spark:你的专属数字协作者
这是首款面向普通用户的个人 AI 智能体,深度集成于 Gemini app:
- 运行于 Google Cloud 专属虚拟机,提供 24/7 全天候服务;
- 由 Gemini 3.5 与 Antigravity 驱动,可自主执行多步骤、长周期任务;
- 原生支持 Google 生态工具,数周内将通过 MCP 接入第三方服务;
- 交互方式多样:Gemini app 内直达、邮件/聊天软件接入、Android Halo UI 实时追踪、Chrome 浏览器内置助手;
- 本周起向可信测试者推送,下周起向美国 Google AI Ultra 订阅用户开放 Beta。
智能体时代的搜索:从信息检索到主动服务
今日起,Google 搜索引入信息智能体(Information Agents):可设置为后台长期运行,主动发现、整合并推送关键信息,甚至协助执行操作。该功能今夏率先面向 Google AI Pro/Ultra 用户开放。
搜索还将具备生成式UI能力:基于 Gemini 3.5 Flash 与 Antigravity,动态生成定制化布局与交互效果,今夏向所有用户免费开放;针对长周期任务,可创建持久化仪表板,成为用户专属的‘迷你应用’,未来数月将支持用户在搜索中自主构建。
更多智能体新品速览
- Daily Brief:Gemini app 内置智能体,自动分析邮箱、日历、待办事项,生成带优先级排序与行动建议的晨间简报;
- Google Flow:全新通用型智能体,支持复杂任务推理与规划,内置‘氛围编程(Vibe code)’,可快速定制视频特效、手绘动画等创意工具;
- Google Pics:基于 Nano Banana 的新一代AI图像创作与编辑工具,将画面元素视为独立可交互对象,实现像素级精细控制;即日起开放可信测试,今夏晚些时候面向 Workspace Pro/Ultra 用户上线;
- 智能眼镜进展:音频眼镜(实时语音协助)与显示眼镜(情境信息即时呈现)双线推进,音频眼镜将于今秋上市;
- Gemini for Science:汇聚 Deep Think、Deep Research 等能力,无缝连接全球 30+ 生命科学数据库;Science Skills 已上线 GitHub 与 Antigravity,Labs 体验申请即刻开启。
从 TPU 8i 的底层算力,到 Gemini 3.5 的模型突破,再到 Antigravity 与 Spark 构建的智能体生态——我们确信:Gemini 智能体时代已然开启。
这不仅是技术的演进,更是我们践行‘整合信息,使人受益’使命的全新篇章。我们期待,这些能力能让技术更平实、好用,真正赋能全球每一个人。”
