needhelp
← 返回博客

Google I/O 2026 全景深度解读:从 AI 助手到 AI 代理的范式跃迁

作者 needhelp
Google I/O
Gemini
AI Agent
Android XR
Antigravity

时间:2026年5月19日(美国太平洋时间)
地点:加州山景城 Shoreline Amphitheatre
主题:Agentic Era(代理式 AI 时代)
核心叙事:AI 不再只是回答问题的工具,而是能在云端 7×24 小时替你执行任务的数字代理


Google I/O 2026 大会现场概念图


一、大会概览:一个清晰的战略转向

2026 年的 Google I/O 大会,是近年来最具战略清晰度的一届。CEO 桑达尔·皮查伊(Sundar Pichai) 在开场几分钟内就定下了基调:今年属于 Agent(代理)——不再是回答问题、生成内容的 AI 助手,而是能够自主规划、执行并验证自身工作的软件代理。 (新浪财经) 这一叙事贯穿了整场 keynote 的每一个环节:从 Gemini 3.5 系列模型的发布,到 Gemini Spark 个人代理的亮相,再到 Google Search 的全面 AI 化重构,以及面向开发者的 Antigravity 2.0 平台——每一个重大发布都指向同一个方向。

皮查伊披露了一组令人瞩目的数据:Google 目前的 月 Token 处理量已达到 3.2 千万亿(quadrillion),较去年同期增长 7 倍;Gemini 应用的 月活跃用户突破 9 亿(新浪财经) 这意味着 Google 的 AI 基础设施已经具备了支撑大规模代理式工作负载的能力,而本届 I/O 正是向外界展示这一能力如何转化为终端产品体验的窗口。

值得注意的是,本届 I/O 几乎没有发布任何 Android 17 的新消息——这部分内容在上周的 Android Show 中已提前释放。这也从侧面印证了一个信号:在 Google 的战略优先级中,AI 代理已经超越了移动操作系统更新,成为公司资源投入的核心焦点。


二、Gemini 3.5 模型家族:速度与智能的新平衡

Gemini 3.5 Flash 概念图

2.1 Gemini 3.5 Flash:已上线的”默认模型”

Gemini 3.5 Flash 是本届 I/O 上最先亮相、也是最具 immediate impact 的产品。它于发布当日(5月19日)即在全球范围内上线,成为 Gemini App、Google Search AI Mode、Gemini API、AI Studio 以及 Antigravity 平台的默认模型(Gadgets 360)

Google 为这款模型打出了三个核心卖点:

维度Gemini 3.5 Flash 表现对比基准
输出速度289 tokens/秒 (DoNews)比 Claude Opus 4.7 和 GPT-5.5 快 4 倍
API 成本$1.50 / $9.00(每百万输入/输出 token) (digitalapplied.com)比竞品 Pro 级模型便宜 3 倍以上
Agent 性能MCP Atlas 83.6%、Toolathlon 56.5% (digitalapplied.com)超越 Gemini 3.1 Pro,领先 GPT-5.5 和 Claude Opus 4.7

从基准测试数据来看,Gemini 3.5 Flash 的定位颇为巧妙。它并非在每一个维度上都碾压竞品,而是在 Agentic 工作流(MCP Atlas、Toolathlon)速度-成本比 这两个 Google 最看重的维度上建立了显著优势。对于需要模型在 tight loop 中反复调用工具、执行多步骤任务的代理场景而言,单次调用快 4 倍、便宜 3 倍的累积效应,意味着 wall-clock 时间和总体成本可能降低一个数量级(digitalapplied.com)

模型基准测试对比

2.2 令人震惊的演示:12 小时生成操作系统

在 I/O 舞台上,Google 展示了一个极具说服力的案例:利用 Antigravity 平台 和 Gemini 3.5 Flash,93 个子代理并行工作,在 12 小时内生成了一个功能完整的操作系统核心,处理了近 26 亿个 token,API 成本不到 1,000 美元(Gadgets 360) 演示团队甚至在这个 AI 生成的操作系统上成功运行了经典游戏 Doom——虽然在初次尝试时因缺少键盘驱动而失败,但 Antigravity 随后实时生成了所需驱动并解决了问题。

这个演示的深层含义在于:它证明了 Gemini 3.5 Flash 不仅是一个”更快的模型”,更是一个能够 驱动大规模自主代理协作 的基础设施级组件。对于企业而言,这意味着全年 token 预算的重新分配——Google 估算,若一家头部科技公司将 80% 的日常工作负载迁移到 Gemini 3.5 Flash,每年可节省超过 10 亿美元(DoNews)

模型输出速度对比

2.3 Gemini 3.5 Pro 与 Gemini Omni

Gemini 3.5 Pro 目前仍在 Google 内部测试中,预计将于 2026 年 6 月 正式推出。作为 Pro 级模型,它将在长上下文处理(MRCR v2)和知识密集型任务(Humanity’s Last Exam)上弥补 Flash 的短板,与 GPT-5.5 和 Claude Opus 4.7 形成真正的同级竞争。 (sohu.com)

Gemini Omni 则是 Google 在”世界模型”方向上的最新探索。它支持 文本、图像、音频、视频任意输入,可输出生成视频,融合了 Gemini 的推理能力与 Nano Banana、Veo 等生成模型的创造力。 (sohu.com) DeepMind CEO Demis Hassabis 将其视为通向 AGI 的重要里程碑——Omni 不仅能理解物理世界的重力和动能,还能通过对话式指令编辑视频中的任意元素。 (MacRumors) Omni Flash 已面向 Google AI Plus/Pro/Ultra 订阅者以及 YouTube Shorts 创作者开放。

API 定价对比


三、Gemini Spark:7×24 小时的个人 AI 代理

Gemini Spark AI 代理概念图

如果说 Gemini 3.5 Flash 是代理时代的基础设施,那么 Gemini Spark 就是面向普通消费者的第一个杀手级应用。这是 Google 首款真正意义上的 “个人 AI 代理”——它运行在 Google Cloud 的专用虚拟机上,不需要你的手机解锁或电脑开机,就能在后台持续执行任务。 (FoneArena.com)

3.1 Spark 的核心能力

Spark 的推出标志着 Google 产品哲学的一次根本性转变:从”你问我答”的对话式 AI,进化为”我帮你做”的代理式 AI。它的典型应用场景包括:

  • 自动账单分析:每月扫描信用卡账单,标记隐藏订阅费用和异常交易
  • 邮件监控与汇总:监控学校、工作相关邮件,提取重要截止日期,向用户及其伴侣发送每日摘要
  • 工作流自动化:将散落在 Gmail 和 Docs 中的会议笔记整合为规范文档,并起草后续跟进邮件
  • 第三方服务集成:通过 MCP(Model Context Protocol)连接 Canva、OpenTable、Instacart 等服务,执行跨应用任务 (FoneArena.com)

Google 特别强调,Spark 在执行发送邮件、消费支付等高风险操作前会 主动请求用户许可,用户可以随时控制代理连接的应用范围和行为边界。 (Tom’s Guide) 不过,官方说明中也保留了一句诚实的提示:Spark “可能会在未询问的情况下分享信息或进行购买”。 (Decrypt)

3.2 推出计划与生态扩展

Spark 的推出采用渐进式策略:

时间受众内容
5月19日当周信任测试者(Trusted Testers)首批内测资格 (Tosea.ai)
5月26日当周美国 Google AI Ultra 订阅者Beta 版开放 (新浪财经)
2026 年夏季macOS 用户Gemini Mac App 集成 Spark,支持本地文件操作 (MacRumors)
2026 年夏季更多第三方应用DoorDash、Asana、Dropbox、Uber 等 MCP 集成 (Tom’s Guide)

Spark 的深层竞争力在于其与 Google Workspace 的原生集成。与 OpenClaw 等需要用户开放本地设备的方案不同,Spark 完全运行在云端,这意味着它可以在不牺牲设备安全性的前提下,深度访问 Gmail、Docs、Sheets、Slides 中的数据。 (Decrypt) 今年夏天,Spark 还将获得短信和邮件指令能力——你可以直接给 Spark 发一封邮件或一条短信来布置任务。


四、Google Search 全面 AI 化:搜索框的范式革命

Google Search AI Mode 概念图

4.1 从搜索引擎到任务引擎

本届 I/O 上,Google Search 的变革可能是对普通用户影响最深远的一项。Google 正在将搜索从一个”信息检索工具”重构为一个 “任务执行引擎”——不仅能回答问题,还能主动监控、持续追踪、动态生成界面。 (The Keyword)

最直观的变化是 AI Mode 搜索框 的重构:输入越长,搜索框自动扩展;支持 AI 驱动的自动补全,能够预测用户意图;由 Gemini 3.5 Flash 驱动,支持附加文档、照片、视频甚至 Chrome 标签页进行提问。 (新浪财经)

4.2 三大新功能解析

信息代理(Information Agents) 是 Search 向”主动式服务”转型的关键。用户可以设置代理 7×24 小时监控特定话题——股票价格波动、房源上新、球鞋发售、体育赛事结果等——当检测到重要变化时,代理会主动推送通知。 (手机新浪网) 这意味着搜索行为从”我主动搜”变成了”它主动告诉我”。

Mini Apps 则将搜索能力推向了个性化仪表盘的方向。Search 可以为特定任务生成自定义追踪器和仪表盘——比如规划婚礼、管理搬家、建立健康计划。 (The Keyword) 这些 Mini Apps 是基于 Antigravity 的代理式编码能力实时生成的,能够调用实时数据源(本地天气、地图、商家评价等)。

Generative UI 是底层技术的集中体现:根据搜索结果,Search 会 动态生成不同的页面布局——对于物理问题可能生成交互式模拟器,对于产品比较可能生成表格和图表,对于操作指南可能生成步骤分解卡片。 (The Keyword)

功能描述推出时间
AI Mode 重构Gemini 3.5 Flash 驱动,支持多模态附件提问已上线 (The Keyword)
Information Agents7×24 后台监控,主动推送更新2026 年夏季 (The Keyword)
Generative UI根据查询动态生成交互式界面2026 年夏季,免费 (The Keyword)
Mini Apps自定义仪表盘和任务追踪器未来数月,Pro/Ultra 优先 (The Keyword)
Personal Intelligence连接 Gmail、Photos 等个人数据已扩展至近 200 个国家 (The Keyword)

五、智能眼镜(Android XR):抢占 AI 穿戴入口

Android XR 智能眼镜产品图

5.1 两条产品线的差异化策略

Google 在 I/O 2026 上正式展示了与 三星(硬件技术)、高通(芯片)、Gentle Monster 和 Warby Parker(设计) 合作开发的 Android XR 智能眼镜产品线。 (The Keyword) 这是 Google 自 2015 年 Google Glass 失败以来,在智能眼镜领域最有诚意的回归——而这一次,策略明显更加务实和分化。

音频眼镜(Audio Glasses) 将于今年 秋季上市,是首先推出的产品线。它没有显示屏,外观接近普通光学眼镜,内置扬声器、麦克风和摄像头,支持 Gemini 语音交互、实时翻译、导航指引和拍照功能,兼容 Android 和 iPhone。 (The Keyword) 从功能定位上看,它直接对标 Meta Ray-Ban 智能眼镜,但在设计合作方(Gentle Monster、Warby Parker)的选择上更强调时尚感。

显示眼镜(Display Glasses) 仍在开发中,镜片内嵌微型显示屏,可显示短信、实时导航箭头和搜索结果卡片,支持 Nano Banana AI 图像生成。 (aibase.com) 这款产品的技术挑战更大,上市时间也相应推迟。

特性音频眼镜(Audio Glasses)显示眼镜(Display Glasses)
显示屏单镜片微型显示屏 (aibase.com)
上市时间2026 年秋季 (The Keyword)开发中,时间未定
核心交互语音 + 骨传导音频 (The Verge)语音 + 视觉卡片 (aibase.com)
重量目标< 46g (aibase.com)略重(含显示模组)
续航约 10 小时 (aibase.com)待定
芯片高通 Snapdragon AR1 (The Verge)高通 XR2+ Gen 2 (aibase.com)
设计合作Gentle Monster、Warby Parker (The Keyword)三星(显示技术) (The Keyword)
手机兼容Android + iPhone (The Keyword)主要为 Android

5.2 Project Aura:Xreal 合作的”有线 XR 眼镜”

除了与三星合作的无线眼镜产品线,Google 还展示了与 Xreal 合作的 Project Aura 原型机——这是一款 有线 XR 眼镜,通过线缆连接到一个独立的计算模块(兼具电池和触控板功能)。 (TechRadar)

Project Aura 的定位更偏向”头戴式显示器”而非日常佩戴眼镜。它提供 70 度视场角——这是 Xreal 有史以来最大的光学透视显示,能够在用户视野中叠加丰富的数字内容。 (xreal.com) 在演示中,用户可以通过它运行 Lightroom、观看 YouTube、玩 3D 桌面游戏,甚至通过 Circle to Search 识别墙上的艺术品。 (The Verge)

Project Aura 的战略价值在于:它为 Android XR 生态系统提供了一个高端参考设计,展示了 Android XR 应用无需修改即可在不同形态设备上运行的能力。这对于解决 XR 行业长期面临的”应用荒”问题至关重要。 (The Verge)


六、Workspace 与创意工具:生产力全家桶的 AI 升级

Google 创意工具概念图

Google 在本次 I/O 上对 Workspace 生产力套件进行了全面的 AI 化升级,几乎每一个核心应用都获得了新的 AI 能力:

6.1 Workspace 核心应用升级

应用新功能推出时间订阅要求
Gmail Live对话式搜索邮件,自然语言查询收件箱 (MacRumors)2026 年夏季Pro / Ultra
Docs Live语音创建和编辑文档,“头脑 dump”后 AI 自动整理 (MacRumors)2026 年夏季Pro / Ultra
Google Keep AI将零散想法自动整理为结构化的简洁笔记 (手机新浪网)已逐步推出Plus / Pro / Ultra
AI Inbox智能收件箱分类和优先级排序 (Tosea.ai)已推出Plus / Pro / Ultra
Universal Cart跨 Search 和 Gemini App 的统一购物车 (Tosea.ai)已推出所有用户

6.2 全新创意工具矩阵

Google 在本次 I/O 上推出了一套面向创意工作者的新工具,形成了从图像生成到 UI 设计的完整链路:

Google Pics 是一款 AI 图像生成与设计工具,功能对标 Canva,可以创建海报、传单、信息图表等内容,所有生成内容都带有 SynthID 水印标识。 (MacRumors) 它将于 2026 年夏季推出。

Stitch 是一个类似 Figma 的 UI/UX 设计工具,用户可以通过自然语言提示或语音指令将粗略想法转化为精美的界面设计——比如直接说”做一个电商产品页,主色调蓝色,包含用户评价区块”,Stitch 就能生成可导出的设计稿。 (MacRumors) 今年新增的功能包括 Stitch Agent 实时协作设计、导出到 Antigravity、以及直接发布到 Netlify。

Google Flow / Flow Music 是移动端 AI 视频和音乐创作应用。Flow 已集成 Gemini Omni,支持从文本或图像生成电影级视频;Flow Music 则允许用户上传录音,然后用提示词让 Gemini 3.5 生成额外的音乐元素。 (MacRumors) 这两款应用已在 iOS 和 Android 平台上线。


七、订阅与计费调整:为代理时代定价

Google 对 AI 订阅体系进行了重要的结构性调整,这些变化透露出公司对”代理式 AI”商业模式的深层思考:

7.1 新定价结构

订阅档位月费Gemini App 使用限额核心权益
AI Plus$81x(基准)基础 AI 功能,YouTube Premium Lite (The New Stack)
AI Pro$201x标准 AI 功能,2TB 存储
AI Ultra(新)$1005x Pro20TB 存储,YouTube Premium,Antigravity 优先访问 (saudishopper.com.sa)
AI Ultra(顶级)$200(原$250)20x ProGemini Spark 访问权,Project Genie (saudishopper.com.sa)

7.2 从”提示次数”到”计算量”

最具战略意义的调整不是价格本身,而是 计费模式的根本变化。Google 正在从传统的”每日提示次数限制”转向 “计算使用量(compute-used)“模式——限额根据提示复杂度、功能使用和对话长度动态分配,每 5 小时刷新一次。 (新浪财经)

这一变化的深层含义是:Google 希望你运行 Agent,而不是发送聊天消息。 代理式任务通常涉及数百次模型调用、多轮工具使用和长上下文维护——在传统的”按提示计费”模式下,这种使用方式会迅速耗尽配额。而”按计算量计费”模式则为长期运行的代理工作负载提供了更合理的资源分配框架。 (Tosea.ai)

订阅定价对比


八、开发者生态:Antigravity 2.0 与 AI Studio 的 Vibe Coding

Antigravity 2.0 开发平台概念图

8.1 Antigravity 2.0:Agent-First 开发平台

Antigravity 2.0 是 Google 为”代理时代”打造的核心开发基础设施。它已从单纯的编程环境演化为一个可以 开发和管理 AI 代理集群(cohorts of autonomous AI agents) 的综合平台。 (Google for Developers Blog)

关键更新包括:

  • 独立桌面应用:Antigravity 2.0 现已成为 macOS、Linux 和 Windows 上的独立桌面应用,配备 CLI 命令行接口 (Google for Developers Blog)
  • 动态子代理:开发者可以协调多个专门化的子代理协同完成复杂任务,所有操作在跨平台终端沙箱中运行,内置凭证掩码和加固的 Git 策略 (Google for Developers Blog)
  • 速度优化版本:Antigravity 内置的 Flash 优化版本响应速度达到其他前沿模型的 12 倍 (DoNews)
  • Managed Agents API:单个 API 调用即可部署一个完整的远程沙箱代理 (Google for Developers Blog)

前文提到的”12 小时生成操作系统”演示,正是基于 Antigravity 2.0 的代理编排能力完成的。这个案例向开发者传递了一个明确信号:Antigravity 不仅是一个代码生成工具,更是一个能够 自主规划、编码、调试和部署 的代理操作系统。

8.2 AI Studio:自然语言生成 Android 应用

Google AI Studio 获得了原生 Android 支持,正式进入了”Vibe Coding”赛道。开发者现在可以用自然语言描述应用想法,AI Studio 会生成完整的 Kotlin 代码,并在一个 内置的 Android 模拟器 中实时预览。 (Digit)

完整的开发-部署链路包括:

  1. 自然语言描述应用需求(支持中文、英文等)
  2. AI Studio 生成完整项目代码(基于 Antigravity + Firebase)
  3. 在内置模拟器或连接的实体手机上测试
  4. 一键导出到 Android Studio 继续开发
  5. 直接发布到 Google Play Store(需通过现有审核流程) (Digit)

目前,这一功能主要面向轻量级工具类应用。对于需要访问摄像头、GPS 等硬件功能的应用,AI Studio 也能生成相应的权限申请和 API 调用代码。 (Digit)


九、Gemini for Science 与 WeatherNext:AI 向善

在 keynote 的尾声,Demis Hassabis 回归舞台,分享了 Google DeepMind 在科学领域的最新进展。 (Engadget)

Gemini for Science 是一套面向科研工作者的 AI 工具集合,包括:

  • AI Co-Scientist:基于 Gemini 的多代理虚拟科研协作者,能够综合大量信息生成新假设和研究提案。在生物医学领域,它已提出针对肝纤维化的新药重定位候选方案,并通过了实验室验证 (deepmind.google)
  • AlphaEvolve:用于设计高级算法的 Gemini 驱动编码代理,已在 Google 数据中心效率优化、芯片设计和 AI 训练流程改进中展现价值 (deepmind.google)
  • AlphaGenome:帮助科学家理解 DNA 非编码区域的 AI 模型,有望加速基因组生物学和疾病理解 (deepmind.google)
  • WeatherNext:最先进的天气预测模型家族,已与美国国家飓风中心合作,帮助预测飓风路径。在 2025 年飓风 Melissa 期间,WeatherNext 提供了更准确、更激进的预测,帮助牙买加等地提前做好准备 (yahoo.com)

Hassabis 在演讲尾声抛出了一个引发全场思考的论断:“通用人工智能(AGI)已经出现在地平线上。如果建设得当,它将促进人类进步和繁荣,超越我们最疯狂的想象。” (yahoo.com)


十、总结:代理时代的 Google 蓝图

产品可用性时间线

回顾整场 Google I/O 2026,一个清晰的战略蓝图浮现出来:

在模型层,Gemini 3.5 Flash 以”速度×智能×成本”的最优组合成为代理工作负载的默认引擎,Omni 拓展了多模态生成的边界,Pro 即将补齐长上下文和知识深度的短板。

在应用层,Gemini Spark 是 Google 向”代理式 AI”转型的标志性产品——它不再是一个等待指令的聊天机器人,而是一个在云端持续运转、主动完成任务的数字员工。

在入口层,Google Search 的全面 AI 化和 Android XR 智能眼镜的布局,表明 Google 正在为代理式 AI 寻找最高频的用户接触点——搜索框和穿戴设备。

在开发者层,Antigravity 2.0 和 AI Studio 的 Vibe Coding 降低了代理应用的开发门槛,让更多开发者能够参与到这个生态的建设中。

在商业模式层,从”按提示计费”到”按计算量计费”的转变,预示着 Google 预期未来的 AI 使用方式将发生根本性变化——不再是偶尔的对话,而是持续的代理运行。

正如 The Verge 的评价:“本届 I/O 的核心叙事很明确——从’AI 助手’进化为’AI 代理’。”


本文部分数据与信息来源于 Google 官方博客、The Verge、9to5Google、WIRED、MacRumors 等媒体报道,以及 Google I/O 2026 官方直播内容。

分享本页