打开网易新闻 查看精彩图片

新智元报道

编辑:编辑部

【新智元导读】谷歌CEO劈柴在年度战略会议上放出狠话,2025年将是AI领域生死存亡之年。一场足以改变AI未来走向的巅峰对决,即将在2025年全面打响。

2025年还未开始,硅谷的战鼓已经擂响。

在这场AI巨头之间的角力中,谷歌CEO劈柴放出了一记重磅炸弹。

在谷歌山景城总部举行的年度战略会议上,身着节日毛衣的劈柴语气凝重地对员工们说道——

2025年将是关键的一年! 我们必须认识到当下时刻的紧迫性,公司需要以更快的速度前进。这是一个颠覆性时刻,赌注从未如此之高。

打开网易新闻 查看精彩图片

这番话背后,是谷歌与微软OpenAI之间愈演愈烈的较量。

自ChatGPT横空出世以来,这家搜索引擎巨头一直在努力追赶。过去两年,谷歌的努力几乎总被爱抢风头的OpenAI盖了过去。

直到12月,Gemini 2.0 Flash、Veo 2、「谷歌版o1」Gemini 2.0 Flash Thinking等轮番轰炸,一展超越领先模型的潜力。。

这意味着,这场AI竞赛终于迎来了转折点。

打开网易新闻 查看精彩图片

会议现场,劈柴展示了一张大模型的对比图,Gemini 1.5傲然领先于OpenAI等其他竞争对手的模型。

当被问及ChatGPT正成为AI的代名词时,劈柴坦言道,「在历史场长河中,你不必总是第一个,但必须出类拔萃,必须在同类产品中保持第一梯队。这就是2025年的意义所在」。

谷歌开发者关系负责人Logan Kilpatrick多次暗示,明年谷歌真的要发力了。

——预计1月份的目标,完整版Gemini 2.0正式上线。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

甚至,在谷歌DeepMind CEO Hassabis年度总结下面,他称这些都只是开胃菜,好戏将在2025年开始。

打开网易新闻 查看精彩图片

有网友预测道,明年谷歌将会把很多强大模型免费推向所有人,而且还会发布直击o3的竞争模型。

打开网易新闻 查看精彩图片

为了在这场AI革命中占据制高点,谷歌正全力以赴。

Gemini,下一个5亿级用户爆款应用

对谷歌而言, 可能更糟糕的是竞争对手OpenAI在搜索业务的挑战。

虽然谷歌仍主导搜索市场,但GenAI为人们提供了各种访问在线信息的新方式。

而OpenAI正在被更多人看作是AI的代名词,如同国外把谷歌看作搜索的代名词一样。

谷歌背负着巨大的压力,正通过重金投资Gemini,来巩固期在AI领域的领先优势。

打开网易新闻 查看精彩图片

Gemini应用程序允许用户访问许多工具,包括谷歌的聊天机器人。

劈柴表示,「建立大型新业务」是重中之重。

谷歌目前拥有15个用户超过五亿的应用, 而高管们普遍认为Gemini应用将是下一个。

劈柴认为Gemini应用具有「强劲势头」,但也不得不承认「在2025年还有一些工作要做,以缩小差距并建立领导地位」。

劈柴后来补充道:「明年最大的重点是在消费者方面扩展Gemini。」

打开网易新闻 查看精彩图片

此外, 谷歌在美国还被法律缠身,包括其在垄断搜索的法律裁定,以及非法主导在线广告技术的指控。

英国监管机构则暂时认定谷歌的广告技术行为影响了该国的竞争力。

对此,劈柴表示:「这是我们的规模和成功所带来的。这是科技正在大规模影响社会的大趋势的一部分。因此,此时此刻,我们要比以往任何时刻都要确保自己不会分心。」

谷歌,「后来者」居上?

OpenRouterAI的数据显示,谷歌旗下的Gemini在开发者中的市场份额从9月份的约5%,直接飙升至>50%市场份额,遥遥领先,连带股价也上涨了14%。

打开网易新闻 查看精彩图片

而此时,距离OpenAI发布ChatGPT的2022年11月30日,已经整整过去了2年。

早在2017年,Sam Altman在一次邮件交流中就明确表示,谷歌DeepMind是在AGI竞争中最强大的对手,但令他没想到的是,曾经公认的「AI巨头」谷歌却是个「花架子」。

ChatGPT发布以来,几乎成了「AI的代名词」,不仅迅速征服了市场,还连带着微软起飞,在Edge浏览器中嵌入Copilot AI搜索助手,直接断崖式领先。

被寄予厚望的谷歌,反倒是昏招频出,先是Bard难产,又经历AI Overview总结能力大翻车,建议孕妇吸烟、自杀跳桥等等。

打开网易新闻 查看精彩图片

在AI顺风车下,股价不涨反降,谷歌一时间沦为笑柄,被OpenAI打的毫无还手之力,更准确的说,连同台竞技的资格都没有。

让人费解的是,谷歌和DeepMind拥有世界上最好的硬件、最多的训练数据、最顶尖的人才,也发过很多具有划时代意义的论文,如AlphaFold、GenCast等,但为什么就连Anthropic这样的创业公司都打不过?

网友分析的细节原因不胜枚举,一句话来说,就是「船大难掉头」。

从安全性上考虑,谷歌作为世界级独一档的科技巨头,不论发布什么产品,其用户群体都不会小,会涉及到各个种族、不同的意识形态,一点小问题就会被无限放大,而文本生成又是非常主观的,很容易受到训练材料的偏见影响,所以谷歌需要更长的时间进行合规检查。

23年初,谷歌受舆论裹挟,急急忙忙发布Bard,在发布会上关于问题「关于詹姆斯·韦伯太空望远镜,我可以告诉我9岁的孩子它有哪些新发现?」,Bard给出错误答案。

打开网易新闻 查看精彩图片

这直接导致公司股价暴跌8%,市值缩水1000多亿美元,让投资群体和用户大失所望。

但其实OpenAI的产品也经常胡说八道、张冠李戴,不过因为是创业公司,所以大众的容忍度会高很多,产品标注为beta测试,还可以不断迭代修改。

作为大公司的谷歌,也受到更多法律上的限制,比如用户数据的版权问题。

谷歌曾因在AI训练过程中违反欧盟版权法被罚款2.5亿欧元,也是全球首个因AI训练数据被罚款的案例,坐拥金山,却无法使用,无异于自断双臂。

打开网易新闻 查看精彩图片

谷歌的产品线庞大,想要在所有产品中都加入AI驱动,需要非常细致的产品管理能力,而去年末发布的Gemini 1.0,因其过度「多样化」的策略,再次导致股价下跌。

不过,「成功者说什么都是对的」,谷歌重新以王者之姿横扫AI,未来还计划继续引领「智能体」发展,携手浏览器和手机端,全自动实现用户任务。

谷歌年度AI大事件

谷歌并非没有看到AI市场的巨大潜力, 但2024年才算是开始「发力」的一年。

很多有名气的产品基本都是在今年发布的,比如各种版本的Gemini,NotebookLM,Pixel手机上的AI功能等等。

打开网易新闻 查看精彩图片

传送门:https://blog.google/technology/ai/google-ai-news-recap-2024/

谷歌宣称在2024年有「60条重大AI发布」, 不妨看看其中几条主要的基础能力。

Gemini模型

去年12月,谷歌推出首个原生多模态模型Gemini 1.0,打响了谷歌的AI反击战。

它可以同时处理文本、视频、图像、音频和代码等数据,结合了包括数学、物理、历史、法律、医学和伦理在内的 57 个学科,也是第一个在MMLU(大规模多任务语言理解)基准上超越人类专家的模型。

今年2月,谷歌将Gemini 升级到1.5,把上下文窗口从32k提升到100万个token,超越了同时期所有大模型。

在推理性能上也有大幅提升,Bard也正式更名为Gemini

7月,免费版Gemini 1.5 Flash发布,支持40多种语言,覆盖230多个国家和地区,质量和延迟都有大幅提升,尤其是在推理和图像理解方面。

12月推出的Gemini 2.0 Flash集成了多模态和原生工具使用能力,标志着大模型正式迈入「智能体」时代。

基于Gemini 2.0, 谷歌构建了原型项目Mariner,从浏览器出发探索全新的人机交互方式:训练Gemini来理解并推理浏览器屏幕上的信息,包括像素和文本、代码、图像和表单等元素,然后通过实验性的Chrome扩展程序自主完成复杂任务。

打开网易新闻 查看精彩图片

在产品方面,谷歌于今年5月基于Gemini推出Ask Photos功能,用户可以通过输入关键词,如地点、人物和日期,或是类似「主题生日派对」等自然语言概念对照片库进行检索。

打开网易新闻 查看精彩图片

NotebookLM

去年7月,谷歌推出了一款AI驱动的科研和写作助手NotebookLM。

一年后,其底层模型切换为Gemini 1.5 Pro,用户可以上传研究笔记、访谈记录或公司文件,然后提出相关问题以理解和探索复杂材料,支持幻灯片、pdf等多种格式。

打开网易新闻 查看精彩图片

9月,NotebookLM发布重磅Audio Overview功能,模型可以针对用户材料生成两位AI主持人互相讨论的音频,可以帮助用户对材料进行「总结」和「深入讨论」。

不过该功能目前仍然处于实验阶段,比如只会英语,无法打断等问题。

AlphaFold 3

今年5月,谷歌的AlphaFold 3论文在Nature上发表,在预测蛋白质与其他分子类型相互作用上性能提升了至少50%,在某些重要的相互作用类别,其准确率甚至能翻倍。

打开网易新闻 查看精彩图片

论文链接:https://www.nature.com/articles/s41586-024-07487-w

2020年发布的AlphaFold 2实现了蛋白质结构预测的根本性突破,在包括疟疾疫苗、癌症治疗和酶设计等领域辅助数百万科研人员进行新发现,引用超过2万次。

AlphaFold 3则跳出蛋白质,进入广泛的生物分子领域,有可能解锁更多变革性科学成果,比如开发生物可再生材料和更具弹性的作物,加速药物设计和基因组学研究。

11月,研究人员发布了AlphaFold 3模型代码和权重,以供学术使用。

Pixel移动端

1月份,谷歌宣布为新款Galaxy S24系列的录音、笔记等软件基于Gemini Pro提供摘要能力;基于文生图模型Imagen 2,为Galaxy S24图库提供生成式照片编辑功能。

八月,谷歌发布自家手机Pixel 9,使用全新的定制芯片Tensor G4提供AI计算能力,整合了大量AI能力,包括生成定制天气报告、整理截图信息、本地文生图等多种功能。

打开网易新闻 查看精彩图片

其中最重要的Gemini Live,能够以更直观、自然的方式帮助用户计划旅行攻略、解决家庭维修问题、构思礼物等等。

打开网易新闻 查看精彩图片

期待明年谷歌即将带来的礼物。

参考资料:

https://x.com/tsarnick/status/1872927162757726475

https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html

https://techcrunch.com/2024/12/28/google-ceo-says-ai-model-gemini-will-the-companys-biggest-focus-in-2025/

https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html

打开网易新闻 查看精彩图片