生命机器的制造并不容易，但终将在其创造者之外占据世界一席之地|创造者|机器人|生命机器|鸟类

□ Terrence J. Sejnowski

Salk Institute for Biological Studies

← 左右滑动查看更多“详细信息” →

(英) T. J. 普雷斯科特(Tony J. Prescott)

(英)N. F. 莱波拉(Nathan F. Lepora）

(西)P. F. M. J. 范思彻(Paul F. M. J. Verschure)主编；

李长芹，王凯，姚鹏主译

北京：科学出版社，2023.5

ISBN 978-7-03-075297-0

本书汇聚全球十多个国家九十多名顶级专家、百余位研究人员的智慧，将“生命”本身作为系统工程，进行拆解、研究、再组装，是仿生和人机协同领域的一本工具书。生命机器属于生物技术前沿领域，又涉及计算机、电子工程、机器人、能源、系统工程、脑科学、心理学、伦理学等多种学科，本书属于典型的生物交叉类学术成果。全书共7 篇65 章，从路线图、生命、构建基块、能力、仿生系统、生物混合系统和展望等介绍了生命机器的研究现状和进展。本书能够为从事仿生工程、认知机器人等科技创新交叉领域的科研人员提供研究参考。

汇集了来自科学和工程学众多领域的广泛知识，旨在实现所谓的“生命机器”（living machines），即具有与自然进化生物同等能力的人造装置。生命机器的制造并不容易，这有多方面的原因。首先，与目前人工技术利用宏观部件进行组装相比，自然界进化出了分子水平组装的智能材料；其次，身体是由内而外构建的，可以将食物转化为材料来替换细胞内的所有蛋白质，而细胞内本身则发生周期性的更换；最后，视觉、听觉和运动中一些最困难的问题还没有得到解决，我们对大自然如何解决这些难题的直觉可能是误导性的。接下来，我们以视觉为例进行阐释。

麻省理工学院人工智能实验室成立于20 世纪60 年代，它的第一个项目得到了一家军事研究机构的巨额资助，旨在制造可以打乒乓球的机器人。我曾经听过一个故事，项目负责人在经费申请书中忘记了为建造机器人视觉系统申请经费，所以他把这个问题作为暑期研究项目分配给了一个研究生。我曾经问马文·明斯基（Marvin Minsky）这个故事是否属实。他反驳说：“你错了，实际上，我们把问题分配给了本科生。”麻省理工学院档案馆的一份文件证实了他的说法（Papert，1966）。

我们直觉上认为编写视觉程序非常容易，是因为我们可以轻松地看到物体。我们都是视觉方面的专家，因为它对人类生存至关重要，耗费了数百万年时间的进化才得以实现。这误导了早期的人工智能先驱们，使他们低估了视觉程序编写的难度。在20 世纪60 年代，几乎没有人知道计算机视觉最终达到人类的性能水平，需要等待50 多年的时间和实现计算机能力100 万倍的增长（Sejnowski，2018）。

对视觉进行仔细观察后发现，我们甚至不知道自然界究竟解决了哪些计算问题。计算机视觉研究者几乎普遍认为，视觉的目标是建立外部世界的内部模型。然而，外部世界完整、准确的内部模型可能并不一定为大多数实际用途所必需，在当前摄像机采样率较低的情况下甚至也不可能实现。根据心理物理学、生理学和解剖学的证据，我和帕特里夏·丘奇兰德（Patricia Churchland）、拉马钱德兰（V. S. Ramachandran）得出的结论是，大脑只反映了世界的有限部分，只反映了任何时刻执行手头任务所需的那一部分（Churchland et al.，1994）。我们之所以会有视野内所有事物均为高分辨率的错觉，是因为我们可以快速地重新调整眼睛定位。同样，显著的视觉模块化也是一种错觉。视觉系统整合了来自其他信息流的信息，包括奖励系统内对场景中对象价值的指示信号，运动系统通过重新定位传感器（如移动眼睛，某些物种是移动耳朵）来主动寻找信息，以收集可能导致奖励行为的信息。感觉系统本身并不是终点；它们逐步进化来支持运动系统，使运动更有效率、生存更有可能。

直到最近，人工智能研究人员采用的主要方法是通过编写计算机程序来解决问题。相比之下，我们通过获取外部世界经验来学习怎么解决问题。我们有很多种学习系统，包括显式事件和特殊对象的叙述性学习、内隐感知学习、运动技能学习等。学习是我们人类的特殊能力。人工智能中语音识别、图像目标识别和语言翻译方面的最新进展是产生于受大脑一般性特征所启发的深度学习网络，这些特征包括大规模并行简单处理单元、处理单元之间的高度连接性，以及通过经验学习获得的连接优势（Sejnowski，2018）。通过观察动物行为并研究大脑，从中发现发挥作用的算法，我们可以从大自然中学习到更多的东西。

在一个不确定、不稳定的世界，适应性是生存的必要条件。在所有无脊椎动物和脊椎动物中发现的强化学习，其基础是探索环境中的各种选项，并根据其选择结果进行学习。在脊椎动物基底神经节中发现的强化学习算法，称为即时差分学习，是一种学习一系列动作以实现目标的在线方法（Sejnowski et al.，2014）。中脑内的多巴胺能神经元负责计算奖励预测误差，可对预测未来奖励的价值函数进行决策和更新。随着学习的改进，探索的减少，最终可以实现对学习过程中所发现最佳策略的完全利用。

强化学习存在的一个问题是非常缓慢，因为来自外部世界的唯一反馈是在一长串动作结束后是否受到奖励，这被称为时间信用分配问题。前面讨论过的视觉局限，即一次只关注一个物体，使得强化学习更容易将可能的感觉输入数量减少，从而有助于获得奖励，使得视觉局限成为一种特征而不是一种缺陷。最近，强化学习与深度学习网络相结合，形成了一种新型神经网络——AlphaGo，它能够击败世界上最好的围棋选手（Sejnowski，2018）。围棋是一种极其复杂的古老棋类游戏，直到最近，最好的围棋程序也远远低于人类的能力。AlphaGo 取得的显著成功表明，多个协同学习系统（每个系统都有各自的局限性）之间协同工作可以实现复杂的行为。

事实证明，建造身体远比想象的更困难。在20 世纪80 年代，一种常见的忽视大自然的观点认为，如果你想制造一台飞行器研究鸟类是非常愚蠢的。但是，正如第1 章“生命机器概述”中所指出的，建造了人类第一架飞机的莱特兄弟对研究鸟类滑翔非常感兴趣，并将他们的观察应用于飞机翅膀的设计。翱翔的鸟类通常依靠大气中上升的热羽流来寻找猎物或远距离迁徙（图F1）。最近，强化学习被用来教导滑翔机如何在模拟热湍流中翱翔（Reddy et al.，2016）以及在野外真正翱翔（Reddy et al.，in press）。滑翔机学习到的控制策略能够产生类似于鸟类翱翔的行为（图F2）。这是人工智能如何开始解决现实世界问题的另一个例子。我们注意到喷气式飞机在机翼尖端增加了小翼，类似于飞翔鸟类的翼尖（图F1）。这些小翼可以节省数百万美元的喷气燃料。进化已经用了数百万年的时间来优化飞行，忽视大自然是非常愚蠢的。

图F1 翱翔的鸟类有翼尖羽毛，可以从下面打破气流。这些羽毛还可以向上弯曲，形成一排小翼。图片来源：约翰·莱恩哈德（John Lienhard）

图F2 对滑翔机学习在热气流中飞行的模拟。上图：瑞利-贝纳尔对流（Rayleigh-Bénard convection）三维数值模拟中垂直速度场（a）和温度场（b）的快照。对于垂直速度场，红色和蓝色分别表示向上和向下的大气流区域。对于温度场，红色和蓝色分别表示高温和低温区域。下图：未受过训练（c）和受过训练（d）的滑翔机在瑞利-贝纳尔湍流中飞行的典型轨迹。颜色表示滑翔机遭遇的垂直风速。绿点和红点分别表示轨迹的起点和终点。未受过训练的滑翔机做出随机决定并下降，而训练有素的滑翔机在强劲上升气流区域以特有的螺旋模式飞行，正如在鸟类和滑翔机的热气流飞行中所观察到的那样。转载自 Gautam Reddy, Antonio Celani, Terrence J. Sejnowski and Massimo Vergassol, Learning to soar in turbulent environments, Proceedings of the National Academy of Sciences of the United States of America, 113 （33）, pp. E4877–E4884, Figure 1, doi.org/10.1073/pnas.1606075113, a, 2016

敏捷性是生命机器的另一座圣杯。蜂鸟以其快速和精确的运动能力而闻名。运动性要求将感觉信息快速整合到控制系统中，以逃避障碍及接近目标，如花朵中的花蜜。最近对超过25 种蜂鸟的研究表明，快速旋转和急转弯能力是通过改变翅膀形态进化发展而来的，而加速动作能力则是通过改变肌肉力量进化而来的（图F3）（Dakin et al.，2018）。

图F3 蜂鸟的飞行性能。（a）跟踪系统以每秒200 帧的速度记录身体位置（蓝点）和方向（红线）。这些数据用于识别模式化的平移、旋转和复杂转弯。动作序列显示蜂鸟首先做出一次俯仰横滚转弯（PRT），继之以减速（DecHor）、弧形转弯（Arc）和加速（AccHor）动作。整个动作序列持续时间为2.5s，每5 帧显示一次。（b）在200只蜂鸟中记录的平移、旋转和转弯次数。（c）性能指标的转换和旋转示例。转载自Roslyn Dakin, Paolo S. Segre, Andrew D. Straw, Douglas L. Altshuler, Morphology, muscle capacity, skill, and maneuvering ability in hummingbirds, Science, 359（6376）, pp. 653–657, doi: 10.1126/science.aao7104, © 2018 The Authors. Reprinted with permission from AAAS

人类发明了轮子以提高运输效率，似乎这是一项大自然无法实现的工程成就。可实际上，大自然要聪明得多，反而发明了“行走”。我们以一个半径为6 英尺（约1.8 米）的轮子为例，当它转动时，每根辐轮依次与地面接触，支撑其他所有脱离地面的辐轮。更有效的设计只需要两根辐条：两根辐轮依次接触地面前进。双辐轮甚至在崎岖不平的地面上也能很好地运转。这证明了莱斯利·奥格尔（Leslie Orgel）的第二条法则：进化要比你聪明得多。奥格尔是一位化学家，他在索尔克研究所（Salk Institute）从事生命起源研究。

生命机器的感觉运动协调是一个动态过程，它要求感觉信息与分层结构控制系统相互集成：脊髓反射能够快速纠正意外干扰，但缺乏灵活性；位于中脑的另一个控制层能够在更长的时间尺度上调节脊髓反射，以应对变化更缓慢的情况，如平滑的地形；基于大脑皮质，视觉和听觉信息整合的长期规划更加灵活，但速度也要慢得多。约翰·道尔（John Doyle）认为，灵活性与速度之间的权衡是驱动分层控制系统的核心原则（图F4）。这种控制与通信观点的核心是减少时间延迟，可以通过预测性编码加以实现（Rao and Ballard，1999；Adams et al.，2013）。

图F4 灵活性和速度之间的权衡。系统可以设计成慢速灵活、快速不灵活，或者沿这两种极端情况之间连线（虚线）周围分布。虚线外的控制系统非常脆弱，虚线内的控制系统相对具有鲁棒性。图片来源：约翰·道尔（John Doyle）

生命机器设计师所要面临的挑战是自主性，这是大自然存在的必要条件。例如，细菌已经适应了各种极端环境，从海洋中的热液喷口到南极洲的冰原，还有你的肠道，这些地方栖息着成千上万种微生物。像大肠杆菌（Escherichia coli）这样的细菌已经发展出向食物源梯度较高处游动的算法。因为它们太小（直径只有几微米），无法直接感知这种梯度，所以它们利用趋化性，即周期性的翻滚和向随机方向前进（Berg，2003）。这样做似乎适得其反，但通过调整游动时间使其在更高浓度下完成更长距离游动，它们就可以可靠地沿梯度向上游动。细菌比最聪明的生物学家还要聪明，生物学家到现在还没有弄清楚细菌如何在如此广泛的环境中生存。从本书中总结的所有进展来看，制造生命机器的前景从来没有这么好。大自然始终是丰富的灵感来源。正如鸟类飞行的一般原理启发产生了比任何鸟类飞得都要快得多的飞行机器一样，今天建立在大脑一般原理基础上的深度学习网络在有限的一些领域已经开始超越人脑。随着制造材料越来越精细和复杂，内稳态机制越来越强大，我们将不断发现自我组织的新原则，自主性生命机器正在崛起，尽管它一开始发展会很缓慢，但最终将在其创造者之外占据世界一席之地。

本文为《生命机器：仿生与生物混合系统研究手册》[(英) T. J. 普雷斯科特(Tony J. Prescott)，(英)N. F. 莱波拉(Nathan F. Lepora），(西)P. F. M. J. 范思彻(Paul F. M. J. Verschure)主编；李长芹，王凯，姚鹏主译. 北京：科学出版社，2023.5)]一书“序”，标题为编者所加。

ISBN 978-7-03-075297-0

责任编辑：丁慧颖

（本文编辑：刘四旦）

一起阅读科学!

科学出版社│微信ID：sciencepress-cspm

专业品质学术价值

原创好读科学品味

科学出版社视频号

硬核有料视听科学