打开网易新闻 查看精彩图片

一、AI 领域的快速更新让人应接不暇

过去一个月,谷歌和 OpenAI 频繁发布引人注目的与 AI 相关的公告及产品,令 AI 领域的专家们都眼花缭乱,也加剧了二者之间的竞争,这场竞争在临近圣诞假期时愈发白热化。有用户感慨面对如 “消防水带般” 不断涌现的 AI 更新都不知如何应对了,仅在过去 24 小时内就有诸多新品发布,根本停不下来。

二、谷歌的 AI 发布热潮

  1. 应对举措:

    OpenAI 开展 “12 天的 OpenAI” 活动,发布了诸如全 o1 模型(o1-preview 的升级版)、用于高级 “推理” 任务的 o1-pro、公开推出视频生成工具 Sora、给 ChatGPT 增加项目功能、引入具备视频流功能的高级语音特性等。对此,谷歌做出了史无前例的一系列回应发布。

  2. 主要产品介绍:

    1. Gemini 2.0 Flash:响应速度更快的谷歌 AI 模型测试版,专为使用多种输入输出类型的交互体验打造。
    2. Veo 2:能依据文本提示生成逼真 4K 视频片段的视频生成器,有可调节的拍摄及镜头选项,被不少 AI 图像专家誉为迄今最佳视频合成模型。
    3. Imagen 3:能生成具有精致细节、光影效果且构图多样、艺术风格丰富的图像的文本转图像新模型。
    4. Deep Research:作为 Gemini 的高级功能,可充当研究助手,为用户的主题生成详细报告。
    5. Google Gemini Live demo:展示 Gemini AI 模型通过屏幕共享、视频及音频输入进行实时交互能力的展示平台。
    6. NotebookLM updates:文档工具更新了管理内容的新界面、有了音频概述的 AI 主持以及具备更多功能和更高权限的 NotebookLM Plus。
    7. Whisk:能让用户创建并修改特定主题、场景和风格图像的工具。
    8. Project Astra updates:对早前公布的智能 AI 助手进行更新,利用 Gemini 2.0 通过谷歌服务提供即时响应。
    9. Project Mariner:一个利用 Gemini 2.0 帮助用户通过理解页面内容完成浏览器任务的 Chrome 扩展测试。
    10. Gemini 2.0 Flash Thinking:类似 OpenAI 的 o1 的运行时 “推理” AI 模型,利用额外推理运行时间更精准地解决难题。

这些产品尤其是 Google Deep Research、Veo 2 和 Gemini Live 等可能会对 AI 领域产生重大影响,不过它们短时间内大量集中发布,行业需要时间去弄清楚每个产品发布的意义,且后续各产品还会不断出现新变化、衍生版本及竞争对手。

三、行业其他人的看法

  1. Willison 的观点:

    独立 AI 研究员 Simon Willison 表示,以往 12 月大家都会因假期而安静些,这次这么多发布很罕见。他觉得这是 OpenAI 和谷歌激烈竞争的副作用,过去常是 OpenAI 突击发布产品打乱谷歌计划,现在情况反过来了,比如谷歌用 Gemini Flash 2.0 展示流媒体图像和视频抢先于 OpenAI 给 ChatGPT 添加相关功能。

  2. Mollick 的观点:

    技术研究员 Ethan Mollick 提到,尽管 2024 年有人对 AI 持怀疑态度,但 AI 发展并未减速,过去一个月改变了 AI 的状态,速度加快、变化增多,像 o1 这样的新模型甚至能发现学术同行评审都遗漏的错误,展示出 AI 从消费级到更复杂 “推理” 模型的快速发展,如今 AI 行业正以前所未有的速度向前迈进,即便当前本应是科技发布的平静期,大家也都在关注这个异常活跃的 12 月会如何重塑迈向 2025 年的技术格局。

总之,除了谷歌和 OpenAI,Meta、亚马逊等公司也加入了这场 AI 产品发布大战,整个 AI 行业正处于高速发展、竞争激烈且令人目不暇接的阶段。

关注【黑客联盟】带你走进神秘的黑客世界