人工智能专家获诺奖，是希望之光，还是灾难前奏？|希望之光|机器人|计算机视觉|诺奖|超级智能

10.27知识分子The Intellectual

瑞典皇家科学院当地时间10月8日宣布，将2024年诺贝尔物理学奖授予约翰-霍普菲尔德（John J. Hopfield）和图灵奖得主、AI教父杰弗里-辛顿（Geoffrey E. Hinton），"以表彰他们利用人工神经网络进行机器学习的奠基性发现和发明"。

此消息一出，立即在网络上引发了热烈讨论。人们纷纷质疑，物理学诺奖颁给AI教父？机器学习算物理学？历届诺贝尔物理学奖得主恐怕都没有想到，自己或许有一天得和代表计算机领域最高荣誉的图灵奖“抢饭碗”。

就连获奖的辛顿都说：“我从来都没想过会被提名诺贝尔物理学奖，我怎么知道你们是不是在恶搞我？”

然而，不可否认的是，人工智能已经悄然改变着我们的生活方式。如今人工智能专家获得了诺贝尔物理学奖，是人类的希望之光，还是灾难的前奏？

对于人们的疑惑，颁发此奖的瑞典皇家科学院在发布的新闻稿中表示，今年的两位诺贝尔物理学奖得主利用物理学工具开发出的方法，为当今强大的机器学习奠定了基础。

DeepMind联合创始人、微软人工智能CEO穆斯塔法·苏莱曼指出，我们正在迎来一场新技术浪潮，人工智能、合成生物技术，以及更多伟大的技术创新，正如潮水一般席卷全球，为各行各业创造全新的业务模式和发展机会。

他的新书《浪潮将至：技术、权力与未来的冲击》正是对这一波澜壮阔的技术浪潮的深刻洞察和前瞻性分析。在这本书中，穆斯塔法以其丰富的实践经验和敏锐的洞察力，深入探讨了人工智能等前沿领域的发展趋势及其对社会、经济和文化的深远影响。

01 人工智能之春

人工智能是即将到来的技术浪潮的核心。

自 1955 年“人工智能”这个词首次提出以来，它很多时候更像是一个遥远的愿景。在将近半个世纪之后，突破性的时刻才终于到来。

2012 年，一个名为 AlexNet 的系统崭露头角。AlexNet 的成功源于一种旧技术的复兴，这种技术现已成为人工智能的基础，为人工智能领域注入了巨大活力。对我们在 DeepMind 的工作来说，它也是不可或缺的。那便是深度学习。

深度学习使用的神经网络大致模仿了人类大脑的神经网络构造。简单来说，这些系统会在其网络被海量数据“训练”的过程中进行“学习”。

在 AlexNet 的案例中，它的训练数据主要由图像构成。图像中的每个红色、绿色或蓝色像素都会被赋予一个数值，由此生成的数组被输入神经网络。在神经网络内部，“神经元”通过一系列带有权重的连接与其他神经元相互关联，这些权重大致反映了信息输入之间的关联强度。神经网络的每一层都会将其接收的信息传递给下一层，从而创建出越来越抽象的表征形式。

然后，一种称为反向传播的技术介入，它负责调整网络连接的权重以优化神经网络。当系统发现错误时，这种调整会反向传播回网络，帮助网络在未来纠正相同的错误。通过不断重复这个过程并微调权重，神经网络的性能会逐渐提高。最终，它将从接收的单个像素开始学习，识别出线条、边缘和形状，最终理解场景中的整个物体。简言之，这就是深度学习。深度学习技术曾一度在人工智能领域受到嘲笑，但最终它攻克了计算机视觉的难题，在人工智能世界掀起了一场风暴。

AlexNet 由传奇研究员杰弗里·辛顿及其两名学生—多伦多大学的亚历克斯·克里哲夫斯基和伊利亚·萨特斯基弗共同开发。他们参加了由斯坦福大学李飞飞教授发起的ImageNet大规模视觉识别挑战赛，这项一年一度的竞赛旨在汇集业界力量，共同攻克一个目标：让计算机能够识别图像中的主要物体。每年，参赛团队都会拿出自己最好的模型，相互激烈竞争，通常每一年新模型的准确度提升较上一年都不超过 1 个百分点。

但在 2012年，AlexNet以10%的准确度提升打败了上一年的冠军。这听起来似乎只是一点儿小小的改进，但对人工智能研究人员来说，这已是跨越式的进步，足以区分那些玩具般的研究演示和那些即将对现实世界产生重大影响的突破性成果。那一年的比赛非常激动人心，辛顿和他的团队发表的论文也成了人工智能研究史上被引用次数最多的作品之一。

随着 AlexNet 这一重大突破的出现，人工智能突然成为学术、政府和企业领域的关键议题。杰弗里·辛顿和他的团队被谷歌招入麾下。美国和中国的重要科技公司都将机器学习视为研发工作的核心。在成功开发 DQN 后不久，我们将 DeepMind 出售给了谷歌。这家科技巨头迅速在其全线产品中转向了“人工智能优先”的战略。

深度学习让计算机视觉技术无处不在，且运行顺畅。现在，该技术能通过相当于 21个全高清屏幕的视觉输入，即每秒约25亿像素的输入，对动态真实世界街景进行分类。这种精确度足以让 SUV汽车在繁忙的城市街道中自如穿梭。智能手机能识别各种物体和场景，在视频通话时，视觉系统可以自动模糊背景，突出人物。

深度学习的繁荣吸引了数十亿美元的资金流入学术机构以及私营和公共企业的人工智能研究。大约从2010年起，人工智能再次成为舆论的焦点，频频占据新闻头条，并不断拓展技术可能性的边界，其热度和炒作甚至超过了以往任何时候。人工智能将在 21 世纪发挥重大作用，这已不再是一种边缘或荒谬的观点，而是大势所趋。

02 人工智能正席卷世界

人工智能的大规模应用已如火如荼。

放眼望去，软件已经深入生活的方方面面，帮助我们搜集和分析海量数据。这些数据正用于训练人工智能系统，使其能够在我们日常生活的几乎每个领域创造出更高效、更精准的产品。

同时，人工智能的获取和使用也变得日益便捷：因为有了如 Meta 的 PyTorch（一个开源的深度学习框架）和 OpenAI 的应用程序编程接口（API）这样的工具和基础设施，非专业人士也能轻松掌握尖端的机器学习能力。此外，5G（第五代移动通信技术）网络和其无所不及的连通性为我们构建了一个庞大且持续在线的用户群体。

人工智能正逐步从演示阶段过渡到现实世界的应用中。

要不了几年，人工智能将能以与人类一样的方式对话、推理，甚至采取行动。它们的感知系统将和我们的一样敏锐。这并不等同于它们达到了超级智能水平，但它们确实会成为异常强大的系统。这意味着人工智能将紧密地融入我们的社会结构，成为其不可分割的一部分。

人工智能系统能够管理零售仓库、提供邮件写作建议、推荐歌曲、检测欺诈行为、撰写故事、诊断罕见疾病，甚至模拟气候变化的影响。它们出现在商店、学校、医院、办公室、法庭和家庭中。如今，你每天都会和人工智能互动很多次；未来，这种互动将更加频繁。几乎在任何方面，人工智能都将使人类体验变得更加高效、快速、实用和顺畅。

人工智能已经在我们身边了，但这仅仅是个开始。

03 大语言模型的崛起

就在不久前，处理自然语言对现代人工智能而言还是一件过于复杂、多变和微妙的事情。

然而，2022 年 11 月，人工智能研究公司 OpenAI 推出了 ChatGPT（一款聊天机器人程序）。短短一周内，它的用户数量就突破了 100 万，人们热烈地讨论着这项技术，广为称赞。

简单来说，ChatGPT 就是一个聊天机器人。但它比以往任何公开亮相的产品都更强大和博学多才。你向它提问，它会立刻用流畅的语句回答你。无论是要求它用詹姆斯国王钦定版《圣经》，还是用20 世纪80 年代说唱歌手的风格来写一篇文章、新闻稿或商业计划，它都能在几秒钟内按要求完成。让它写物理课程大纲、节食手册或者Python 脚本，它也游刃有余。

没过多久，OpenAI 推出了GPT—2，其中的GPT 指的是“生成式预训练变换器”。GPT—2 当时的规模相当庞大，拥有高达15 亿个参数（参数数量是衡量AI 系统规模和复杂程度的重要指标）。它是在800 万页网页文本的基础上进行训练的。然而，直到2020 年夏天OpenAI 发布了GPT—3，人们才真正开始意识到这一技术的巨大潜力。GPT—3 的参数数量高达1 750 亿，成为当时人类构建过的最大的神经网络，规模相比仅一年前推出的GPT—2 大了上百倍。这的确令人叹为观止，但如今这样的规模已经变得不足为奇，而且训练同等级别模型的成本在过去两年中已经大幅下降为1/10。

当GPT—4 在 2023 年 3 月亮相时，它再次引发了轰动。和之前的版本一样，你让 GPT—4 以艾米莉·狄金森的风格写诗，它会照办；你让它续写《魔戒》的某个片段，它能立刻模仿出一段与原作者托尔金风格相似的文字；你向它索要创业计划，它就能输出一份看似由一群高管共同制订的专业计划。不仅如此，它还能在各种标准化考试中脱颖而出，从律师资格考试到 GRE（留学研究生入学考试），它都能应对自如。

GPT—4 还能处理图像和代码、创建能在桌面浏览器中运行的 3D（三维）电脑游戏、开发手机应用、调试代码、识别合同漏洞、为新药研发提供结构建议，甚至给出避免侵犯专利权的药物修改建议。它可以根据手绘草图生成网站，能够理解复杂场景中的微妙人物关系；你给它看冰箱内部的照片，它能根据冰箱里的食材推荐菜谱；你给它一份粗糙的演示文稿，它能帮你润色并设计成一份专业的演示文件。它似乎能够理解空间与因果关系、医学知识、法律条文和人类心理学。

在GPT—4发布后的短短几天内，人们就利用它开发出了一系列工具，用于自动化诉讼处理、为共同抚养子女提供支持或提供实时的时尚建议等。几周内，又有人为GPT—4创建了插件，使其能够胜任创建手机应用、进行市场调研以及撰写详细报告等复杂任务。

不久之后，人工智能就能像人类一样，将其所学从一个领域轻松应用到另一个领域。现在只是初步展现出自我反思和自我提升迹象的人工智能，将实现巨大的飞跃。这些人工能力智能系统将接入互联网，能够与我们人类生活的方方面面进行交互，但它们将建立在一个深厚的知识和能力基础之上。它们不仅将精通语言，还将胜任各种令人眼花缭乱的任务。

人工智能仍处于早期阶段。如果现在有人宣称人工智能名不副实，那么他可能会赢得一些目光和关注。但事实是，越来越多的人才和投资正源源不断地涌入人工智能研究领域，这样的投入最终势必意味着重大的变革。

04 超越超级智能

许多人工智能领域的人（更不用说哲学家、小说家、电影制作人以及科幻迷）对人工智能的意识问题产生了浓厚兴趣。他们曾连续数日在会议上探讨这样的问题：我们能否创造出真正具有自我意识且这种自我意识能被我们识别和确认的智能体？

与此同时，人们也对“超级智能”这个概念产生了极大的兴趣。在过去10 年里，科技领域的知识分子和政治精英都热衷于相信这样一个观点：一种能够不断自我优化的人工智能将引发一场名为“奇点”的“智能大爆炸”。人们为此争论不休，试图确定这一事件可能发生的确切时间，是2045 年、2050 年，还是更遥远的未来。然而，尽管讨论热烈，相关论文和博客文章层出不穷，但这一问题依旧没有定论。只要谈及人工智能，这些话题就总是不可避免。

我认为，关于奇点是否会来以及什么时间会来的争论，完全是一个具有误导性的议题。试图预测通用人工智能的出现时间就像在占卜未来一样不可靠。当过分痴迷于超级智能这样的概念时，人们往往会忽视那些正在逐步实现的短期目标和进展。在我参与的众多会议中，我希望引导人们关注合成媒体、错误信息、隐私以及致命自主武器等紧迫的现实问题，但最终总是花费时间回应与会者关于机器人意识、奇点等与现实世界有些脱节的问题。

多年来，人们一直将通用人工智能视为一个非此即彼的问题——要么已然实现，要么还未达到，仿佛存在一个明确的门槛，以某个特定的系统跨越它为标志。我始终认为这种看法是错误的。相反，我认为这是一个渐进的过程，在这个过程中，人工智能系统的能力将不断提升，逐步接近通用人工智能的水平。这更像是一场已经在进行中的平稳演变，而不是一次突如其来的飞跃。

因此，我们无须把自己卷入那些晦涩难懂的辩论中，无须关心意识是否源于某种机器永远无法触及的、神秘且难以定义的“火花”，也不需要去想它是否会从我们今天所知的神经网络中自然涌现出来。目前而言，重要的是系统能够做什么，而不是它是否具有自我意识、理解能力或类人智能。关注到这一点，我们才能真正看清我们所面临的挑战：每一天，系统的能力都在不断增强，能做的事情也越来越多。

我们不应过分纠结于人工智能的意识问题，而应重新将讨论焦点集中在人工智能的近期能力发展及其未来几年的演变趋势上。正如我们所见，从辛顿的AlexNet 到谷歌的LaMDA， 10 多年来，人工智能模型的改进速度一直呈指数级增长。这些技术能力已经切实存在，同时它们的发展速度没有任何放缓的迹象。尽管它们已经产生了巨大的影响，但随着我们在未来几年内继续努力，以及人工智能逐渐能够独立完成复杂的、多步骤的端到端任务，它们的影响将变得更加显著且深远。

我认为，可以称那样的时刻为“人工能力智能”，即人工智能可以在最低程度的监督下完成复杂的目标和任务。人工智能和通用人工智能这些词我们常能听到，但我们还需要一个概念来描述它们之间的一个中间阶段。在这个阶段，现代图灵测试已经成功，但系统还没展现出那种失控的“超级智能”。人工能力智能就是这个阶段的简称。

人工智能的早期阶段主要关注分类和预测。尽管它具备一定的能力，但这些能力仅局限于明确界定的范围和预设的任务内。例如，它可以区分图像中的猫和狗，并根据序列预测接下来的内容，从而生成这些猫和狗的图片。它展现出了创造力的火花，并且可以迅速被集成到科技公司的产品中。

人工能力智能代表着人工智能发展的下一个重要阶段。在这一阶段，人工智能系统不仅可以识别和生成与特定语境相契合的新颖的图像、音频和语言，还能实时与真实用户进行交互。它凭借增强的记忆能力，能在较长时间内维持这些能力的一致性，并能够利用其他数据来源，如第三方的知识、产品或供应链组件数据库等。这样的系统能利用这些资源，把多个行动安排整合成长期的计划和方案，以追求更为复杂和开放的目标，比如设立并运营一个亚马逊市场商店。所有这一切都将极大地扩展人工智能工具的使用，提升其执行一系列广泛的复杂实用任务的能力。这便是真正具备能力的人工智能。

有意识的超级智能？那还是个未知数。但能够通过某种形式的现代图灵测试的高度智能系统—人工能力智能呢？毫无疑问，它们已在研发中，甚至已经有了雏形。未来，我们将看到成千上万这样的模型涌现，并被全球大多数人使用。这将引领我们进入一个新时代，届时，人人都能拥有一个能够助力甚至直接实现众多可想象目标的人工能力智能：从规划假期、设计建造效能更高的太阳能电池板，到助力竞选活动。

至少从某种意义上说，人工智能的未来是可预见的。未来5 年，我们将继续投入大量资源。全球最聪明的人才正致力于解决这些问题。算力的巨大提升将催生出顶级的模型。所有这一切都将推动人工智能取得更为显著的进步，包括在实现具有想象力、推理能力、规划能力和常识的人工智能方面取得重大突破。不久之后，人工智能就能像人类一样，将其所学从一个领域轻松应用到另一个领域。现在只是初步展现出自我反思和自我提升迹象的人工智能，将实现巨大的飞跃。这些人工能力智能系统将接入互联网，能够与我们人类生活的方方面面进行交互，但它们将建立在一个深厚的知识和能力基础之上。它们不仅将精通语言，还将胜任各种令人眼花缭乱的任务。

人工智能绝不仅仅是一项新技术那么简单，它比任何技术都要深刻得多、强大得多。真正的风险并不在于对其过度炒作，而在于我们可能低估了即将到来的技术浪潮的规模。人工智能不仅仅是一种工具或平台，而且是一种具有变革性的元技术，是推动技术和一切事物发展的背后的力量。它本身就是工具和平台的创造者，不仅仅是一个系统，而且是一个能够生成各种类型系统的生成器。让我们退一步想想，从10 年或100 年的角度来看待这一切。我们确实正处在人类历史的转折点上。

然而，即将到来的技术浪潮不仅仅是关于人工智能的。

DeepMind联合创始人、微软人工智能CEO穆斯塔法·苏莱曼重磅作品《浪潮将至》

技术、权力与未来的冲击

The Coming Wave: Technology, Power, and the 21st Century’s Greatest Dilemma

定价：79.00元

书号：978-7-5217-6848-0

作者：穆斯塔法·苏莱曼（Mustafa Suleyman）

迈克尔·巴斯卡尔（Michael Bhaskar）

出版时间：2024年10月

内容简介：

人工智能、生物技术、量子计算……我们正在接近人类历史的一个关键节点，这一节点决定着人类命运的未来走向。我们已被人工智能包围，生活中的一切都将改变。人工智能将组织我们的生活，经营我们的生意，管理核心的政府服务。我们将生活在一个有DNA打印机、量子计算机和机器人助手的能源丰富的世界里。

作为开创性的人工智能公司DeepMind的联合创始人和微软人工智能的CEO，作者穆斯塔法·苏莱曼一直处于这场浪潮的中心。他认为，未来10年将被这一波强大、快速扩散的新技术所定义。在这本书中，苏莱曼以通俗易懂、冷静犀利的笔触，展示了这些力量将如何创造巨大的繁荣，又将如何威胁到作为全球秩序基础的民族国家。他既引领我们了解激进技术变革的历史，又引领我们面对深刻的社会挑战。

这本书为我们提供了一剂现实的镇静剂，逻辑清晰地描述了当前的技术冲击，又不乏新意和趣味，引人深思。

作者简介：

微软人工智能CEO。曾与戴密斯·哈萨比斯等联合创办人工智能公司DeepMind，后任谷歌公司人工智能产品与政策副总裁。2022年，与领英联合创始人里德·霍夫曼等共同创办了Inflection AI，该公司获得高达13亿美元的投资，估值一举突破40亿美元。2023年和2024年，两次入选《时代》周刊发布的全球“百大AI影响力人物”榜单。