Google I/O总结：Gemini更新，推出视频模型Veo，新增AI概述搜索功能|gmail|人工智能|应用程序|搜索功能|视频模型|谷歌

鞭牛士报道，5月15日消息，据CNBC报道，谷歌周二举办了年度 I/O 开发者大会，并推出了一系列人工智能产品，从新的搜索和聊天功能到面向云客户的人工智能硬件。这些发布强调了该公司对人工智能的关注，以抵御 OpenAI 等竞争对手。

谷歌推出的许多功能或工具仅处于测试阶段或仅限于开发人员，但它们让人们了解谷歌如何看待人工智能以及其投资方向。

谷歌通过人工智能赚钱，通过向使用其模型的开发人员和支付 Gemini Advanced 费用的客户收取费用，Gemini Advanced 是ChatGPT的竞争对手，每月费用为 19.99 美元，可以帮助用户总结 PDF、Google 文档等。

周二发布的公告是在其人工智能竞争对手举办的类似活动之后发布的。本月早些时候，亚马逊支持的Anthropic 宣布推出其首个企业产品和免费 iPhone 应用程序。与此同时，OpenAI 周一推出了新的人工智能模型和 ChatGPT 桌面版本，以及新的用户界面。

以下是谷歌宣布的内容。

Gemini人工智能更新

谷歌推出了Gemini 1.5 Pro 的更新，其人工智能模型很快将能够处理更多数据——例如，该工具可以总结用户上传的 1,500 页文本。

还有一个新的 Gemini 1.5 Flash AI 模型，该公司表示该模型更具成本效益，专为较小的任务而设计，例如快速总结对话、为图像和视频添加字幕以及从大型文档中提取数据。

Google 首席执行官Sundar Pichai强调了 Gemini 翻译的改进，并补充说它将以 35 种语言向全球所有开发人员提供。

Pichai 表示，在 Gmail 中，Gemini 1.5 Pro 将分析附加的 PDF 和视频，提供摘要等内容。这意味着，如果您在假期期间错过了一封很长的电子邮件，Gemini将能够将其连同任何附件一起进行总结。

新的 Gemini 更新也有助于搜索 Gmail。该公司举了一个例子：如果您一直在比较不同承包商修复屋顶的价格，并正在寻找一份摘要来帮助您决定选择谁，Gemini 可以返回三个报价以及不同电子邮件中提供的预期开始日期线程。

谷歌表示，Gemini 最终将取代 Android 手机上的 Google Assistant，这意味着它将成为苹果的更强大竞争对手iPhone 上的 Siri。

Google Veo、Imagen 3 和音频概述

谷歌发布了用于生成高清视频的最新模型Veo，以及最高质量的文本到图像模型 Imagen 3，该模型承诺提供逼真的图像，并且比之前的模型更少分散注意力的视觉伪影。

这些工具将于周一向选定的创作者开放，并将登陆谷歌的机器学习平台 Vertex AI，让开发人员可以训练和部署人工智能应用程序。在那之前，将会有一个等候名单。

该公司还展示了音频概述，即根据文本输入生成音频讨论的能力。例如，如果用户上传课程计划，聊天机器人可以说出其摘要。或者，如果您要求提供现实生活中科学问题的示例，它可以通过交互式音频来实现。

另外，该公司还展示了AI Sandbox，这是一系列生成式人工智能工具，用于根据用户提示从头开始创建音乐和声音。

然而，聊天机器人和图像创建器等生成式人工智能工具仍然存在准确性问题。

谷歌搜索主管普拉巴卡尔·拉加万(Prabhakar Raghavan)上个月告诉员工，竞争对手可能有一个人们喜欢玩的新小发明，但他们仍然来到谷歌来验证他们在那里看到的内容，因为它是值得信赖的来源，而且变得更加关键”在这个生成人工智能的时代。

今年早些时候，谷歌推出了由 Gemini 驱动的图像生成器。用户发现历史错误在网上疯传，该公司取消了该功能，并表示将在未来几周内重新推出该功能。该功能尚未重新发布。

新的搜索功能

谷歌搜索负责人 Liz Reid 表示，谷歌将于周一在美国谷歌搜索中推出人工智能概述，人工智能概述显示最复杂搜索问题答案的快速摘要。

例如，如果用户搜索清洁皮靴的最佳方法，结果页面可能会在顶部显示人工智能概述，其中包含从网络上合成的信息中收集的多步骤清洁过程。

该公司表示，计划直接在搜索中引入类似助手的规划功能。它解释说，用户将能够搜索类似为一组易于准备的 3 天膳食计划之类的内容，然后将从网络上获得各种食谱作为起点。

至于在提供多模态或在生成人工智能工具中集成更多图像和视频方面取得的进展，谷歌表示将开始测试用户通过视频提问的能力，例如拍摄他们拥有的产品的问题、上传并要求搜索引擎找出问题所在。

在一个例子中，谷歌展示了一个人在拍摄一台坏掉的电唱机的同时询问它为什么不能工作的情况。谷歌搜索找到了电唱机的型号，并表明它可能因平衡不正确而出现故障。

测试中的另一项名为AI Teammate的新功能将集成到用户的 Google Workspace 中。它可以通过消息和电子邮件线程以及更多 PDF 和文档构建可搜索的作品集。

例如，准创始人可以问 AI 队友：我们准备好发布了吗？助手将根据 Gmail、Google Docs 和其他 Workspace 应用程序中可以访问的信息提供分析和摘要。

Project Astra计划

Project Astra 是谷歌人工智能助手的最新进展，该助手由谷歌 DeepMind 人工智能部门构建。目前它只是一个原型，但你可以将其视为谷歌开发自己版本的贾维斯的目标，贾维斯是托尼·斯塔克来自漫威宇宙的全能人工智能助手。

在 Google I/O 大会上展示的演示视频中，助手通过视频和音频，而不是聊天机器人界面，能够帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。

当发言人出现在视频中时，该发言人就会被呼叫。

谷歌表示，一个真正有用的聊天机器人需要让用户自然地与它交谈，没有滞后或延迟。演示视频中的对话是实时发生的，没有延迟。

该演示是在OpenAI 周一展示与 ChatGPT 的类似音频来回对话之后进行的。

DeepMind 首席执行官 Demis Hassabis 在台上表示，将响应时间缩短为对话式的内容是一项艰巨的工程挑战。

皮查伊表示，他预计 Project Astra 将于今年晚些时候在 Gemini 启动。

人工智能硬件

最后，谷歌宣布推出第六代 TPU（即张量处理单元）Trillium，这是运行复杂 AI 操作不可或缺的硬件，将于 2024 年底向云客户提供。

TPU 无意与其他芯片竞争，例如Nvidia 的芯片图形处理单元。例如，皮查伊在 I/O 大会上指出，谷歌云将于 2025 年初开始提供 Nvidia 的 Blackwell GPU。

Nvidia 在 3 月份表示，谷歌将使用 Blackwell 平台进行各种内部部署，并将成为首批提供 Blackwell 支持的实例的云提供商之一，并且访问 Nvidia 的系统将有助于谷歌为企业提供大规模工具开发人员构建大型语言模型。

皮查伊在演讲中强调了谷歌与英伟达的长期合作伙伴关系。两家公司已经合作了十多年，皮查伊过去曾表示，他预计他们在十年后仍将如此。

Google I/O总结：Gemini更新，推出视频模型Veo，新增AI概述搜索功能

热搜

热门跟贴

热搜

热门跟贴

相关推荐

美国绝密武器被谷歌曝光，外形似星战飞船，究竟有多大还不知道！

两大重磅消息：中方人工智能人才流向美国？美诱骗中方对台动武

铁路上的人工智能，藏在乘客看不见的角落

北约找上了中国，人工智能决定未来战争胜负，中国要不要谈判？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

3集：在托尼和索尔的帮助下，最强人工智能幻视诞生

任正非：中国人工智能不可能快速发展，因为中国缺数学家

MWC上海 | 今年的MWC上海应该怎么逛？详细攻略看这里

颠覆百度？5款AI搜索PK，结果一言难尽

牛逼大哥遇见了牛逼二哥 网友:一个是感应 一个是人工智能

这台新机一发布，全世界垃圾佬都得疯

今日起，Mac版ChatGPT应用人人可下！GPT-4o语音功能却再鸽一个月

当人工智能要消除人类时！人们该何去何从

鹦鹉比人工智能还智能，说话办事样样能行

，黄仁勋：英伟达的灵魂 ，已具备想象通用人形机器人的必要技术

有律师竟然把蒋介石洗白为英雄烈士，网友怒了：互联网如此疯狂？

媒体：以色列或面临又一场大战 对手比哈马斯强悍得多

掌握方法很重要，xbox下载游戏慢，下载慢怎么办

30岁"借调"女干部退回原单位 不希望借调函被放入档案

工信部对《人工智能 大模型训练数据处理流程及质量评价模型》等12项行业标准计划项目公开征集意见

牛逼大哥遇见了牛逼二哥网友:一个是感应一个是人工智能

，黄仁勋：英伟达的灵魂，已具备想象通用人形机器人的必要技术

媒体：以色列或面临又一场大战对手比哈马斯强悍得多

30岁"借调"女干部退回原单位不希望借调函被放入档案

工信部对《人工智能大模型训练数据处理流程及质量评价模型》等12项行业标准计划项目公开征集意见