打开网易新闻 查看精彩图片

就在OpenAI以其改进的ChatGPT人工智能模型给人留下深刻印象的第二天,谷歌展示了一个同样令人惊叹的愿景,即人工智能将如何改进数十亿人每天使用的产品。

谷歌在一年一度的谷歌I/O开发者大会上宣布了这些更新,目前该公司正试图通过新设备和人工智能驱动的工具,推动其核心广告业务以外的业务。在这次活动中,人工智能是人们最关注的话题,谷歌首席执行官桑达尔·皮查伊在演讲结束时表示,“人工智能”这个词被提到了120次,这是由谷歌的人工智能平台Gemini统计的。

在主题演讲中,谷歌展示了它希望自己的人工智能产品如何成为用户生活中更重要的一部分,比如分享信息、与他人互动、在家里寻找物品、制定日程、购物和使用安卓设备。谷歌本质上希望它的人工智能成为你所做的一切的一部分。

皮查伊在发布会一开始就强调了其最新人工智能模型Gemini 1.5 Pro的各种新功能。一项名为“照片询问”(Ask Photos)的新功能允许用户搜索照片,以获得更深入的见解,比如通过查看保存的照片,询问你女儿什么时候学会游泳,或者回忆起你的车牌号码。

他还向用户展示了如何让Gemini 1.5 Pro通过分析附件、总结关键点和提出行动计划来总结孩子学校最近发来的所有电子邮件。

与此同时,谷歌的高管们轮流展示了其他能力,比如最新的模型如何“阅读”教科书,并将其变成一种人工智能讲座,由声音自然的老师回答问题。

就在一天前,科技行业人工智能领域的领导者之一OpenAI公布了一种新的人工智能模型,该模型将使聊天机器人ChatGPT更智能、更容易使用。gpt - 40的目标是将ChatGPT变成一个数字个人助理,可以进行实时、口头的对话,并通过文本和“视觉”进行互动。它可以查看用户上传的截图、照片、文档或图表,并进行对话。

谷歌还展示了Gemini的最新功能,可以接收不同类型的输入——“多模式”功能,可以接收文本、语音或图像——作为对ChatGPT的直接回应。谷歌的一位高管还展示了一个虚拟的“队友”,可以帮助你完成待办事项、组织数据和管理工作流程。

该公司还强调了搜索的改进,允许用户提出更自然或更集中的问题,并提供各种版本的回答,如深入或总结的结果。它还可以提供有针对性的建议,比如在某些地点推荐适合儿童的餐厅,或者通过谷歌镜头(Google Lens)拍摄摄像头等设备可能出现的问题,从而指出问题所在。该公司表示,其目标是减少在谷歌上搜索的跑腿工作。

该公司还简要介绍了由谷歌DeepMind人工智能实验室开发的“阿斯特拉项目”(Project Astra),该项目将允许人工智能助手通过手机摄像头解读现实世界的信息,例如识别物体,甚至找到放错地方的物品,从而帮助用户的日常生活。它还暗示了它将如何在增强现实眼镜上工作。

谷歌表示,今年晚些时候,它将把更多的人工智能功能集成到手机中。例如,用户将能够将人工智能创建的图像拖放到Google Messages和Gmail中,并在Android设备上询问有关YouTube视频和pdf文件的问题。

还有一项可能会吸引很多人的举措是,Android内置的一个新工具可以帮助检测通话中的可疑活动,比如骗子试图模仿用户的银行账户。

市场研究公司Emarketer的分析师雅各布•伯恩表示,人工智能在今年的谷歌开发者大会上占据中心位置并不奇怪。

他说:“通过展示其最新型号,以及它们将如何为现有产品提供强大的消费者影响力,谷歌正在展示它如何有效地将自己与竞争对手区分开来。”

他认为,新工具的受欢迎程度将是一个指标,表明谷歌能够在多大程度上调整其搜索产品,以满足生成式人工智能时代的需求。

他说:“为了保持竞争优势并满足投资者,谷歌需要专注于将其人工智能创新大规模转化为可盈利的产品和服务。”

随着该公司人工智能业务的增长,该公司表示将引入更多保护措施,以减少潜在的滥用。谷歌正在扩展其现有的SynthID功能,以检测人工智能生成的内容。去年,该工具为人工智能生成的图像和音频添加了水印。

谷歌表示,它还在与专家和机构合作,测试和改进其新模型的功能。

尽管该公司在过去一年里加大了对人工智能的投入,但它也遇到了重大障碍。去年,在推出其生成式人工智能工具(当时名为Bard,后来更名为Gemin)后不久