Demis Hassabis 现任 Google DeepMind 首席执行官,他过去常常在午夜至凌晨 3 点之间完成一些最有成就感的工作。他称自己为“夜行人”,会把自己的独处时间用于阅读科学论文、提出新想法以及纯粹的思考。
如今,Hassabis 的凌晨工作时间却变得「不够用」了。他的许多团队成员都工作在硅谷的谷歌总部,那边的上班时间要比伦敦早八个小时。因此,他的视频会议经常会持续到当地第二天。“大约 18 个月前,我的作息时间依然很好,”他若有所思地说。随着谷歌把 DeepMind 和 Google Brain 合并为 Google DeepMind,Hassabis 也被任命为这一部门的负责人。自此以后,曾经那样的珍贵宁静时光便不复存在了。
这是一个巨大的责任。尽管谷歌多年来一直在谈论要成为一家以 AI 为先的公司,但当前这一波生成式 AI 狂潮却是由 OpenAI 在 2022 年 11 月推出的 ChatGPT 掀起的。尽管谷歌拥有所有的技术实力,也一直在努力将自己确立为将新兴技术转化为实际产品的领导者,但如今正在被迫与无数其他公司竞争,其中就包括 OpenAI 和 OpenAI 的合作伙伴微软。
谷歌将重心放在了 Gemini 上,这是一个大语言模型(LLM),支持谷歌搜索“AI 概览”摘要、起草 Gmail 电子邮件等功能。Gemini 还取代 Google Assistant 成为安卓系统的默认语音 AI。然而,Gemini 还无法取代 ChatGPT 作为头部 AI 聊天机器人的地位,后者具有内置搜索等新功能,正在更加直接地与谷歌展开竞争。谷歌的一些 AI 产品发布也曾沦为公关噩梦,暴露了显而易见缺陷,比如“建议使用胶水把奶酪粘在披萨上”,谷歌愿意传播可能出错的 AI,意味着其早期更为谨慎的心态发生了明显转变,在 ChatGPT 表明当前技术的不成熟不会阻碍其采用之前:“坦率地说,我从来不相信社会可以容忍如此多的幻觉,但事实就是这样,”Google DeepMind 首席运营官 Lila Ibrahim 说。
尽管如此,谷歌还是从其竞争优势中获益了:只需轻轻一按,就可以让 AI 技术惠及大量人群。“目前,谷歌的每一款 10 亿用户产品都集成了 Gemini,”Google DeepMind 产品副总裁 Eli Collins 表示,“我们有 9 款用户超 10 亿的产品。”
正如 Hassabis 所说:“事实证明,我们现在是谷歌的引擎室。”然而,Google DeepMind 的使命远不止于此,与 OpenAI、Anthropic 等公司一样,致力于实现通用人工智能(AGI)。尽管对 AGI 的确切定义各不相同,但业内一致认为,AGI 涉及的领域比当前更加广泛。20 多年前,Shane Legg 建议将 AGI 作为 Ben Goertzel 所著书籍的书名,从而推动了这一术语的普及。
现在,作为 Google DeepMind 首席 AGI 科学家,Legg 将 AGI 定义为“至少可以在人们通常可以完成的认知任务中与人类能力相匹配的东西”。Hassabis 对于某个实体(不一定是谷歌)何时能实现 AGI 留了很大的余地,一边说,“10 年后有 50% 的机会”,又一边说,“如果它发生得更早,我也不会感到惊讶。”
Hassabis 为人谦逊和蔼,说话平静,但语速很快。他一生都在取得巨大成就,最近因 AlphaFold 这项工作与他的同事 John Jumper 一起获得了世界上最崇高的荣誉——诺贝尔奖。AlphaFold 是 AI 辅助蛋白质研究的一项突破,可能会彻底改变药物发现。
尽管如此,Hassabis 的职业生涯却正进入一个充满挑战的新阶段。多年来,他一直被 AI 解决人类最大挑战的潜力所激励,这是他和谷歌共同的愿景,后者允许他以极大的自主权去追求这一目标。但现在,他必须将其与日益增长的压力结合,不断推出新技术,保持产品的相关性。成功与否,取决于他在科学理想和商业现实之间取得平衡的能力。
我 10 月初到访时,经过几天的细雨,伦敦的天空已经放晴,阳光照进会议室里,Hassabis 向我解释了他是如何努力工作,以确保 Google DeepMind 的工作场所没有硅谷特有的密闭氛围。
Google DeepMind 的办公室独具一格,有以“交流电之父” Nikola Tesla 命名和装饰的,还有向世界上第一个程序员 Ada Lovelace、“人工智能之父” Alan Turing 和其他科技杰出人物致敬的,这并不令人惊讶;也有向哲学家 Baruch Spinoza 和 Ludwig Wittgenstein 致敬的;还有以英国小说家 Mary Shelley 命名的,她最著名的作品《科学怪人》(Frankenstein)讲述了 200 年前 AI 出错的故事;还有一家咖啡馆以科幻小说作家 Isaac Asimov 的名字命名,他在 1942 年提出了机器人三定律——第一条是“机器人不得伤害人类,也不得因不作为而让人类受到伤害”。
他们的图书馆,收藏了各种主题的纸质书籍,Hassabis 对物理学家 David Deutsch 于 1997 年出版的量子理论著作《现实的结构》(The Fabric of Reality)特别感兴趣。图书馆内还有科技风格的艺术品,包括大厅里的两个巨大的玻璃钢多面体。根据旁边的标语,这些结构由英裔美国雕塑家 Anthony James 创作,旨在“为数字计算的抽象之美赋予了一种刚硬而闪亮的触感”。
这种多学科氛围反映了 Hassabis 的多元兴趣,涵盖“哲学、艺术和人文”等各个领域,他说,“在价值观和社会方面,我也是这么想的。我觉得世界需要投入它想要的 AI —— 而不仅仅是加州一百平方英里的一块地方。”
游戏,是另一个影响 Hassabis 的重要因素。1976 年,Hassabis 在伦敦出生,他的父亲是希腊裔塞浦路斯人,母亲是新加坡人。仅在 4 岁时,他就在国际象棋比赛中击败了他的父亲和叔叔。8 岁时,他在国际象棋比赛中赚到了足够的钱,买下了自己的第一台个人电脑;后来,他拥有了一台 Commodore Amiga 500,这台电脑在他的记忆中留下了深刻的印象,以至于他们已经从谷歌的其他部门招募了其中一名联合创始人。
17 岁时,Hassabis 开始专业开发视频游戏,其中一款游乐园模拟器游戏卖出了数百万份。1997 年,他从剑桥大学计算机科学专业毕业时,IBM 的国际象棋计算机“深蓝”击败了世界冠军 Garry Kasparov。Hassabis 为之着迷。但他表示,这一里程碑式时刻也是“一个奇怪的死胡同”。“深蓝”是被称为专家系统的一个示例,天生就是为国际象棋大师而生的,但无法接受训练来玩其他游戏,更不用说执行其他类型的工作了。
Hassabis 发现,他对 AI 的另一种方法很感兴趣:神经网络。通过模仿人脑的运作方式,基于该模型构建的软件可以像人一样学会做很多事情。该技术一直受到计算能力的限制,但 Hassabis 坚信,随着超级计算机的功能越来越强大,神经网络可以取得长足进步。
2010 年,DeepMind 成立了,这家初创公司非常低调,最初的网站只有一个标志,没有其他内容。早期,该公司开发了可以玩 20 世纪 70 年代 Atari 视频游戏的软件——不是因为世界需要玩 Atari 游戏的计算机,而是作为开发 AI 的起点,这种 AI 可以自己找出规则和目标,而不需要费力地将它们编码进去。(老式 Atari 游戏卡带仍然堆放在 Google DeepMind 游戏室里。)
在破解了《太空侵略者》和《打砖块》之后,DeepMind 将注意力转向了一项更大的挑战:围棋。这项拥有 2500 年历史的棋盘游戏非常复杂,许多人认为计算机可能永远无法掌握它。2016 年,AlphaGo 软件击败了传奇围棋大师李世石——这是 AI 史上比击败 Kasparov 更伟大的时刻。第二年,一个名为 AlphaGo Zero 的新版本出现了,它无需使用人类游戏数据进行训练,就可以通过自学成为一名更优秀的围棋选手,这是 AI 的另一个重大进步,它以与人类相同的方式学习,但速度要快得多。
但是,DeepMind 作为独立公司的短暂生命很快就结束了。2014 年 1 月,谷歌以 4 亿美元至 6.5 亿美元的价格收购了这家初创公司——与 OpenAI 目前 1570 亿美元的估值相比,这显得很微不足道,但在当时也是一笔不错的数字。当时,投资者并不看好 AI,作为一家初创公司,“筹集 1000 万美元非常困难”,Hassabis 回忆道。他与谷歌联合创始人 Larry Page 和 Sergey Brin 因共同致力于开发 AI 而结缘。
出售给谷歌,“意味着 Hassabis 不必一直花时间与投资者交谈”,DeepMind 的首批员工之一、现任 Google DeepMind 高级总监 Helen King 表示,“他可以专注于推动研究向前发展。”
在 AlphaGo 与李世石的比赛进行时,Hassabis 的思绪转向了涉及比游戏更实质性内容的 AI 研究。“在我看来,下一步是走出实验室,将其应用于现实世界的问题,”他说,“蛋白质折叠是我的首选。”确定蛋白质如何折叠成 3D 结构,可以为药物发现和其他生物技术领域提供关键见解,但这是一个非常艰巨的过程,在数十亿种可能性中,只有大约 100000 种这样的结构被确定下来。AI 能够提供帮助的可能性,是 90 年代的一位大学朋友植入他的脑海中的,当时他们在酒吧玩桌上足球,这位朋友会痴迷地谈论它。
DeepMind 发起了一项将这一过程自动化的计划,并将其命名为 AlphaFold。AlphaFold 的第一个版本,就在 2018 年赢得了两年一度的蛋白质预测竞赛,这对生物技术和 AI 来说都是一个更加非凡的进步。这也证明了 DeepMind 以研究为先的文化可以在谷歌内部蓬勃发展。在撰写了关于使用机器学习进行蛋白质预测的博士论文后,Jumper 加入了 DeepMind,他在 2021 年告诉我,在那里工作“就像每天都在参加 AI 会议一样”。
今年 5 月,谷歌首席执行官 Sundar Pichai 在 Google I/O 开发者大会上将 Hassabis 请上台。这让人觉得这似乎是一个姗姗来迟的举动(Hassabis 当时已在谷歌工作十多年),但时机却恰到好处,因为 Hassabis 的工作已迅速成为公司未来的核心。
Hassabis 身穿标志性的蓝色衬衫,戴着蓝框眼镜,发布了一段视频,展示了“Project Astra”,这是谷歌对下一代 AI 智能体的实验性愿景。Astra 由 Gemini 提供支持,旨在在智能手机或智能眼镜上运行。
从某种程度上来说,这感觉像是一种竞争的必然结果:如果谷歌不发明世界上最好的带眼睛的 AI 助手,就会有其他公司来做这件事。OpenAI 已经预览了类似的 ChatGPT 功能,包括可以解决手写数学问题和根据面部表情读取人的情绪的功能。即使是苹果,尽管对 AI 的态度很谨慎,也正在为 iPhone 提供更多相机辅助智能。
然而,Hassabis 告诉我,他“深度参与”了 Astra 的开发,但他所做的不仅仅是打造一个更智能的 AI 助手。教会软件理解周围环境,也是 Google DeepMind 实现 AGI 的关键。他说,要让计算机像人类一样思考,“你不能只生活在语言和数学的世界里。你必须了解物理世界。”
只关注 AGI 何时到来,会低估 Google DeepMind 和其他研究机构已经取得的进展。例如,AI 已经在理解多种语言方面击败人类,这是谷歌 20 多年来一直热衷的话题。Legg 表示,一个出色的 LLM “可以说 100 种语言,而且可以非常流利地说 30 或 40 种语言。据我所知,没有人能够做到这一点。”Gemini 的一些版本现在可以用多达 102 种语言交谈,包括英语、法语和西班牙语,以及科萨语、马拉地语和乌尔都语等。
无论距离实现 AGI 还有多远,Google DeepMind 都在推进具有巨大潜力的研究项目和机会,而这些项目和机会与谷歌的直接利润无关。2021 年,该公司成立了一家名为 Isomorphic Labs 的公司,致力于将 AlphaFold 技术商业化,Hassabis 担任首席执行官,Google DeepMind 首席商务官 Colin Murdoch 担任总裁。Isomorphic Labs 现在拥有 150 名员工和独立的办公空间,专注于加速药物研发,为 Google DeepMind 提供了另一个与物理世界接触的机会。
此外,Google DeepMind 的研究人员还在努力开展其他应对现实挑战的项目:GraphCast 使用 AI 在不到一分钟的时间内生成准确的 10 天天气预报。GNoME 已经确定了 220 万种新的无机晶体,其中包括 38 万种稳定的晶体,可用于制造从电池到太阳能电池板等各种产品。他们与 EPFL 的瑞士等离子中心合作开发了 Torax,旨在帮助预测如何控制核聚变所需的高于太阳的温度。
“我们拥有一些世界上最好的核聚变专家、生物学家和材料科学家,”研究副总裁 Pushmeet Kohli 说。
这些努力的范围,正是当时的首席执行官 Larry Page 于 9 年前创建 Alphabet(谷歌和其他子公司的控股公司)时所考虑的。他希望开发“登月计划”——新的、可能改变世界的业务,这些业务可能需要数年时间才能孵化,并且不一定与谷歌现有的成功挂钩。
如今,其中一些项目已经褪去光环。即便是其中最知名、最有前途的项目,Waymo 的无人驾驶出租车(Google DeepMind 参与开发了其软件),也只在菲尼克斯、洛杉矶和旧金山实现了全面商业部署。但 Isomorphic Labs 无疑是 Alphabet 级别的项目。Google DeepMind 希望找到更多这样的项目,并让它们实现商业可行性:“我们现在有了一些蓝图,”Murdoch 说。
在大型上市公司内部运营一个雄心勃勃的研究实验室的想法,并不新鲜。Hassabis 对贝尔实验室和施乐帕洛阿尔托研究中心这两家最著名的实验室的历史了如指掌。“这都是我的灵感来源——它们的黄金时代,它们的鼎盛时期——这是我在 DeepMind 尝试创造的东西,”他说。
即使经过深思熟虑,并拥有谷歌规模的资源,也没有什么是万无一失的。科技分析师 Benedict Evans 指出,尽管 AT&T 与贝尔实验室合作取得了成功——发明了激光、晶体管和光伏电池等——但“建立一个通用的创新实验室并推出产品一直很困难。”尽管施乐帕洛阿尔托研究中心是 20 世纪 70 年代许多现代计算元素的诞生地,但它之所以出名,部分原因是施乐未能利用这些元素。
尽管如此,Isomorphic Labs 已经度过了概念验证阶段。今年 1 月,该公司宣布与制药巨头 Eli Lilly 和 Novartis 建立战略合作伙伴关系,该公司表示,这可能会带来近 30 亿美元的预付款,甚至在它参与研发的药物可能获得的特许权使用费之前也是如此。
对于 Alphabet 来说,30 亿美元并不算什么,2023 年该公司的营收为 3070 亿美元,主要来自广告。这笔钱无法满足该公司近期的需求:为其现有的、无处不在的软件产品注入突破性的 AI 功能。然而,Hassabis 的预测却很美好。
“除了治疗可怕的疾病,AI 还有什么更好的用途呢?”他问道。“但我认为,到最后,它对 Alphabet 来说也会非常有价值。我认为这并不矛盾。”
一款面向作家和研究人员的 AI 增强型笔记工具,似乎最不可能在网上成名 15 分钟。但 9 月下旬,谷歌通过音频概览吸引了 TikTok、X 和 YouTube 上的用户,这是去年推出的免费 NotebookLM 网络应用的一项新功能。向其输入参考资料(如 PDF 和网页),它就会使用 Gemini 在两个合成主持人之间就任何主题制作类似播客的对话。他们的对话听起来如此自然——充满了“嗯”、“啊”、笑话和离题话——以至于不知情的听众可能会误以为这是一些由真人主演的晦涩难懂的节目。
Hassabis 看起来有点兴奋,因为他对这种病毒式的喜爱感到高兴(这与谷歌早期的一些 AI 失误形成了鲜明对比),他说他对这种反应感到开心,有些人称之为 Gemini 的 ChatGPT 时刻。“在科学领域,你发表论文,得到评论者,然后你会看到引用,诸如此类的事情,”他说,这“在某些方面更直观,而且非常令人兴奋。”
然而,并不是所有人都对科技行业急于开发越来越强大的 LLM、让基于 LLM 的产品广泛普及以及越来越接近 AGI 感到兴奋。谷歌内部一直存在紧张局势,在 Google DeepMind 成立后不久,被称为“AI 教父”、Google Brain 领导者之一的 Geoffrey Hinton 辞职就是一个很好的例子。Hinton 说,他离开是为了可以更自由地谈论未来的危险。
未来生命研究所执行董事 Anthony Aguirre 表示,谷歌最近推出的一系列 Gemini 功能表明,“他们被迫与 LLM 竞争,因为一旦 OpenAI 打开了这扇门,每个人都必须这样做。”这家非营利组织于 2023 年 3 月发布了一封公开信,呼吁 LLM 开发暂停六个月,已有 33000 多人签名。“我认为这有点不幸,因为我非常喜欢设计 AI 来解决我们实际存在的问题的目标。”
尽管谷歌和其他 AI 公司一样,没有遵从暂停研究的呼吁,但这封公开信确实引发了关于 AGI 潜在生存风险的更坦率的讨论。今年 5 月,Hassabis 和 Legg、Hinton、OpenAI 首席执行官 Sam Altman、Anthropic 联合创始人 Dario Amodei 和 Daniela Amodei、微软首席技术官 Kevin Scott 等签署了一封令人警醒的 23 字公开信:“减轻 AI 灭绝的风险应该成为全球优先事项,与其他社会规模的风险(如流行病和核战争)一样。”
Hassabis 强调,他并不认为可怕的情况是不可避免的;控制 AGI 可能比一些人担心的更简单。但他解释说,通过在这封信上署名,他打算发表一份声明。“我想确保那些谈论这些事情的人能够得到另一群人的保护,他们会说,‘这里没什么可看的,一切都会好起来的——这只是正常的技术’”他说。
负责任地部署 AI 可能只在最近才成为头条新闻,但 DeepMind 早在初创时期就深谙这一点:“在我采访 Legg 时,他谈到了智能体和安全的重要性,”早期招募的现任高级责任总监 King 说。2018 年,随着公司的重点从游戏 AI 转向具有更大潜在影响的工作,如 AlphaFold,拥有一支致力于这项工作的团队,至关重要。
Ibrahim 负责组建这个委员会,她之前曾在英特尔和 Coursera 等公司工作多年,最近才出任首席运营官。起初,“我们实际上称之为‘稍后命名的委员会’,因为我们不想暗示风险很高,”她回忆道。“我们的目标是,建立一种符合 DeepMind 的文化,但又能引导和解决其中一些问题。”
随着时间的推移,CTBNL 的正式名称变成了“安全与责任委员会”。该委员会由来自整个公司的领导组成,负责对正在进行的项目提供反馈,重点是在潜在问题真正出现之前就发现它们。“早期参与是最好的参与方式,这样实际上有助于塑造和影响工作,”负责任开发总监 Dawn Bloxwich 说道。
这种对 AI 安全的预期方法并没有阻止谷歌发布存在明显缺陷的功能,例如那些搜索 AI 概览无法理解人类何时在开玩笑而不是提供有用的建议。“对于我们所做的所有测试,我们永远不会涵盖世界上每个人可能尝试的所有事情,因为人类是有创造力的,”King 说,并指出在某些情况下,问题可能更多地与特定产品的实施有关,而不是 Google DeepMind 为其他谷歌团队提供的核心技术。“每当我们看到安全问题时,它对我们来说都是有用的,因为这样我们就可以推动模型开发的变化。”
谷歌不得不为用户发现的故障道歉,这凸显了它在后 ChatGPT 时代推出新功能的紧迫性。根据 The Information 的 Jon Victor 在 4 月发表的一篇文章,Hassabis 本人对日益强调迅速将 AI 商业化以惠及大众感到不安,这导致 DeepMind 和 Google Brain 合并为 Google DeepMind。
最初,“我有点担心会损害我们的研究路线图,”Hassabis 向我坦言。但随着时间的推移,他认为,整合谷歌的 AI 专业知识和技术堆栈的好处已经变得更加明显:“我们是一家以研究为主导的公司。我们仍然是一个以研究为主导的部门。这与我们对世界的影响完全相辅相成。” Astra 项目就是一个例子。10 月,谷歌重组让 Hassabis 负责 Gemini 应用程序,缩小了 Gemini 产品与其底层 LLM 之间的距离。
在伦敦的总部,走廊墙上挂满了海报,纪念着该公司研究人员在 Science 和 Nature 等科学期刊上发表的每一篇论文。Hassabis 似乎并没有屈服于短期的竞争压力。“他一直坚持的一件事,我完全同意他的观点,那就是我们应该用科学的方法来处理所有这些工作,”James Manyika 说,他从 DeepMind 成立之初就认识 Hassabis,并于 2022 年加入谷歌,担任高级副总裁,专注于技术与社会的融合。“我们应该做实验,我们应该保持严谨,我们应该发表论文。”
这就是 Google DeepMind 的「DeepMind 部分」——重视它,是保护它的第一步。
原作者:Harry McCracken
https://www.fastcompany.com/91230713/the-future-according-to-google-deepmind-demis-hassabis-ai-agi-alphafold-alphago
整理:阮文韵
如需转载或投稿,请直接在公众号内留言
热门跟贴