对谈嘉宾
Ann Kennedy
斯克里普斯研究所的副教授
肯尼迪实验室研究塑造动物对不同竞争需求反应的神经机制。为了生存和繁殖,动物必须平衡何时以及如何对可能引发冲突行为的条件做出反应——例如,在觅食的同时避免捕食者。过去的研究表明,一类称为神经肽的分子在大脑中发挥着重要的调节作用,改变控制动物行为的神经回路的活动。例如,最近的研究确定了某些神经肽的表达会改变社会隔离后的攻击性,或在饥饿时抑制疼痛,使动物即使在受伤时也能觅食。通过运用计算神经科学、统计分析以及神经回路建模等一系列技术,我将确定神经肽如何改变神经群体的活动,以允许攻击性、觅食和伤口护理等生存行为具有灵活性和状态依赖性表达。这项工作将揭示动物如何做出平衡竞争需求的决策,这种认知处理过程在某些神经系统疾病中可能会受损。
主持人
Paul Middlebrooks
卡内基梅隆大学的特聘助理研究员
卡内基梅隆大学的特聘助理研究员,同时是播客“Brain Inspired”的主持人。他主要研究运动皮层和基底神经节神经群体活动如何在自由行为的小鼠中支持自然行为,致力于揭示神经活动与复杂行为之间的关系。
目录:
01 一位理论神经科学家的研究缘起
02 从演化视角看神经系统:内源活动与节律的重要性
03 神经调控的“旋钮”:肽类物质如何塑造行为状态
04 量化行为与理论前沿:从基准数据集到行为预测
05 未来的挑战与对年轻学者的建议
探索生命本能:
一位理论神经科学家的研究缘起
保罗:今天的嘉宾是安·肯尼迪(Ann Kennedy),她是斯克里普斯研究所的副教授,也是理论神经科学与行为实验室的负责人。她的核心研究方向之一,是探索诸如生存、威胁反应、动机、疼痛等对生命至关重要的过程,是如何通过下丘脑这类皮层下脑区进行调控的。
她也关注这些生命过程背后的时间尺度,这引导她去思考某些蛋白质(比如:神经肽)的表达如何影响全脑的神经活动,从而使我们在面临威胁、疼痛等不同情境时能做出恰当反应。在接下来的对话中,你会听到我们讨论为什么这在理论神经科学领域还是一片蓝海。相比之下,理论方法长期以来更常被用于研究大脑皮层的热门区域,而在神经计算方面,大家的目光过去几乎只盯着神经元放电或动作电位,仿佛那是唯一的解法。安倡导结合自上而下与自下而上两种理论研究路径。
此外,我们还讨论了她和团队在Kaggle平台上发起的一项竞赛,旨在为生物体的自动化行为标注建立基准;项目的目标在于,让使用不同记录设备和系统的实验室都能生成一致的行为标签,以此打造一个通用工具供不同研究者使用,并将数据聚合为更庞大、更优质的数据集。
安,几个月前在佐治亚理工学院(Georgia Tech)听了你的演讲,我记得你一开场就说,在一个大家都在聊脑机接口、神经调控的会议上,你感到自己有些格格不入,为什么你会有这种感觉呢?
安:因为这确实不是我们实验室的核心研究方向。组织者里有几位是我的朋友,但我感觉他们的研究更侧重于治疗瘫痪或人类疾病这类实际应用,而我并不是做这个的。那个领域非常吸引人,只是大家的学术背景和具体目标不同。不过,我们之间或许有共同的思考脉络:我们都关心大脑如何自我调节,而作为设备开发者,他们思考的是如何从外部去调节大脑。
保罗:这很有意思,我们稍后再深入聊聊。不过我之前有点惊讶,因为你似乎对“生命过程”表现出兴趣,这与当下神经科学主流的那种计算视角几乎是截然相反的。我当时就在想,我是不是理解错了?你是真的关注生命过程本身,还是想从系统视角去研究不同层级的认知功能?
安:我觉得理论研究的一个好处,就是你能触及很多不同的主题,我确实关注生命过程。我做研究的一个初衷,就是去寻找理论神经科学里那些“少有人走的路”。比如皮层下结构,我们对这些脑区的建模程度,远不如像控制运动、处理感觉的皮层过程那么深入。正是这种研究上的空白把我引向了生命过程的研究,具体来说,就是生存行为,大脑如何根据我们的内在需求来调节外在行为。
我最初进入这个领域,是因为感觉理论学家们对它的探索还不够深入,但后来我发现,其实思考这些问题的人并不少。只不过他们不一定是系统神经科学家,而且也是直到最近,那些负责生存行为、维持我们生命的大脑区域,才真正能够用系统神经科学的工具进行研究,比如达到单细胞分辨率的记录技术,以及刺激和操控手段。
深入这个皮层下的研究领域后,我意识到,理论学家在这里大有可为。我们既可以将那些从行为出发、研究本能与行为的传统模型和思路,与现代系统神经科学的方法联系起来,也能为此做出实实在在的贡献。
保罗:哎,你把我要说的梗给抢了。我本来想开个玩笑说,我学了这么多年神经科学,得出的结论是:只有大脑皮层是有意思的,其他部分都无聊透顶,是吧?
安:没错,那就是个装饰品,纯粹是为了保护中间核心部分的硬壳而已。开玩笑的。
保罗:你确实说过,你对大脑中负责生存和动机的区域更感兴趣,但皮层其实也参与这些过程。只不过传统研究方式可能不那么侧重这方面。
安:确实如此。皮层是与这些深层的皮层下结构共同演化的,它们之间会相互作用,皮层为下层结构提供信息,也大大丰富了它们的功能。不过话说回来,即使没有皮层,生物体也能完成很多基本功能。我特别喜欢提的一个研究,是我在加州理工学院做博士后时,马克斯·迈斯特(Markus Meister)实验室里一位研究生朋友做的工作。
他们找到了一种特殊的小鼠品系,其驱动基因(driver line)能在所有最终发育成皮层和海马体细胞的神经祖细胞(neural progenitors)中表达。这样,研究人员就能在这些祖细胞里表达一种毒素,从而在大脑发育过程中完全移除皮层和海马体。结果,这些小鼠看起来基本正常,只是脑袋显得小一点。它们会更容易焦虑、更具攻击性,但许多小鼠做的事,比如理毛、交配、打斗、逃避威胁,它们都能完成,尽管它们完全缺失了这些(演化上)较晚出现的大脑结构。
它们虽然学习能力不怎么样,但生存繁衍所需的核心能力都具备。因为这些行为是我们最古老的行为本能,“操作手册”就编码在这些皮层下结构里。皮层的作用更像是一个“优化升级包”,它为这些本能行为增添了可塑性和对情境的依赖,但生存的基本盘,靠的还是那些底层结构。
保罗:我正想说,皮层下结构通常被我们认为是这些更偏向本能的行为的根源。说到“先天本能”,人们通常会想到那些与生俱来、像预设程序一样的东西。然而,也有一些研究学习机制的学者声称,这些所谓的“先天”能力其实也是通过学习获得的,也就是说,皮层下结构同样具备学习能力。
安:确实是这样。我很喜欢用“渠化”(canalisation)这个概念来描述:大脑的构造方式,决定了它天生倾向于产生某些特定的输出。但这并不意味着不需要学习。它仍然需要通过经验和活动来微调神经连接,这种学习不一定是像“我教你吃饭或打架”那种监督学习,而是一种基于经验的自我构建。最终,不同个体的这些结构都会收敛到相同的连接模式上。不是说细胞层面完全一样,而是表现出相同的行为库、相同的驱动力,以及跨物种间相似的感觉运动转换机制。
保罗:从动力学系统的视角来看,这就像是深度吸引子(deep attractors)。
安:没错。这个理念源自沃丁顿(Waddington)的“表型景观”理论。有趣的是,他作为生物学家而非数学家,在1957年出版的《基因的策略》(The Strategy of the Genes)一书中,将这些吸引域称为“发育路径”,而不是吸引子。他用一种非常直观的方式描述:基因推动细胞沿着特定的发育轨迹行进,即使你干扰它们使其偏离轨迹,它们也能自我修复并回归正轨。
这本质上就是吸引子概念,只是他当时还没有接触这套数学语言。我认为这种思想既存在于细胞发育中,也体现在大脑的神经连接方式上,神经回路具有吸引子状态,使得动物先天就倾向于形成特定的行为模式。
保罗:你前期的研究大多集中在皮层领域。我知道拉里·阿博特(Larry Abbott)其实对各种脑结构都有广泛研究。
安:我博士阶段研究的是电鱼(electric fish),在这个领域根本不用担心研究成果被人抢先发表。
保罗:看吧,这就是你后来选择研究皮层下结构的原因对吧?一条完美的“防抢发”职业规划。
安:是的。做电鱼研究的时候,你能把所有的文献都读完,甚至认识这个领域所有的实验室。后来我也接触过一点果蝇蘑菇体的工作,但感觉那个领域太拥挤了,太多人扎堆在相同的问题上。直到2011年左右,我在COSIGN会议上听了戴维·安德森(David Anderson)报告林大宇(Dayu Lin)的工作,他们用光遗传学刺激腹内侧下丘脑腹外侧区(VMHvl)神经元,成功诱发了小鼠的攻击行为。那个研究给我的感觉太震撼了,和当时会上其他所有报告都截然不同。
那感觉就像是,你拿着光遗传学这把“锤子”精准敲击大脑的某个部位,虽然方法看起来很人工,却能引发复杂的、依赖视觉引导的行为。这让我意识到,当时大多数研究似乎都忽略了大脑最本质的一个功能:生成复杂行为。当时我心想,这方面肯定还没什么人研究,绝对是个好玩又广阔的处女地。结果后来发现,其实已经有很多人在研究这个了。
保罗:是啊,而且估计这个领域已经有很多积累了。
安:是的。
保罗:我想问你一件事,因为你写过关于演化、早期神经系统甚至前神经系统的文章。这种兴趣是源于你研究生早期的工作吗?
安:其实在我读研之前,曾短期在一个干细胞实验室做过技术员。那时,我做了大量转录因子共转染(co-transfection)实验,观察单个转录因子如何影响少突胶质祖细胞(oligodendrocyte progenitor cell)分化相关基因的表达。
其实那段经历挺偶然的。说来可能有点傻,但直到那时候我才真正意识到,原来身体里不同的细胞会表达不同的基因,发育本身就是一个如此奇妙的过程。可以看到,早在我接触神经科学之前,就已经深深迷上了发育生物学,后来又顺理成章地转向了演化发育生物学(evo-devo),也就是从演化角度来研究发育机制。
我虽然没有真正在那个领域深耕过,但那些领域里思考的核心问题一直让我着迷:一个完整的生物体是如何从单个细胞构建出来的?新的行为或新的功能是如何演化出来的?演化是如何对身体结构的组成部分进行微调,让它们随时间适应环境的?这种机制,高中时代起就让我非常着迷。虽然读研期间它暂时退居次要位置,但它始终是我科研思维中持续跳动的脉搏。
从演化视角看神经系统:
内源活动与节律的重要性
保罗:看来可能是我把顺序搞反了。或许我真正该问的是,你后来是怎么从对发育生物学的兴趣,转向研究自然状态下行为的生物体,并采用动力学系统的框架来理解认知机制的?
安:申请研究生的时候,我也觉得神经科学很酷。我想很多人天生就对大脑的工作原理感到好奇。我当时申请学校,去哥伦比亚大学面试,原因很简单,只是一位教授在给我的选校名单里提到了它。面试时,拉里·阿博特(Larry Abbott)和研究生们见面,他向大家展示了后来成为FORCE算法的研究,那是他与戴维·苏西洛(David Sussillo)合作的工作,通过训练循环神经网络(recurrent neural networks)来生成复杂的行为,也就是复杂的时间序列。
他当时举的例子是:他们用人体行走的运动捕捉数据,训练模型去复现那个步行行为。这简直太令人震撼了,让我一下子产生了强烈的兴趣,很想弄明白这背后的原理,想知道分布式的神经元网络究竟是如何完成如此复杂的事情的。
保罗:我保证后面会聊到你的具体工作。刚才提到的循环神经网络,本质上就是动力系统,因为它既有循环连接,又有动态变化,这正是它的计算基础。无论是像液态机(liquid state machine)那样的模型,还是用FORCE算法来训练RNN,都是如此。
当你看到拉里·阿博特展示这些的时候,你有没有立刻把这种动力系统的视角,与细胞甚至亚细胞层面联系起来?比如联想到皮层下过程?因为你后来发现,这些脑区同样存在着类似的动力系统结构、形态和吸引子等等。
安:现在回过头看确实是这样。但在读研那会儿,完全没往那儿想。当时刚进实验室。我做博士后之后,才接触皮层下结构。
当时感觉自己挺懵懂的。我加入安德森实验室后,光是把VMHvl(腹内侧下丘脑腹外侧区,ventromedial hypothalamus ventrolateral part)这个缩写搞明白、念准确,就花了不少时间。我本科时学过动力系统理论,觉得这是个很酷的应用方向,但当时理论界的主流观点是:单个神经元的膜时间常数(membrane time constants)非常短,它们根本不可能完成需要工作记忆、复杂运动控制,或者长时间信息整合的任务。而循环计算被认为是突破这一限制的途径。
这个观点在我刚开始读研时非常吸引我,头一两年,我花了很多时间,基本上就是试图弄懂循环神经网络能做什么以及它是如何工作的。但这些工作与真实数据联系不大,所以我内心一直在挣扎:“我现在做的这些,到底真的能告诉我们一些关于大脑的奥秘,还是仅仅在研究一个既优美又易于处理的理想动力系统而已?”
保罗:你当时尝试的,是不是就像用井字棋(tic-tac-toe)那样简单的问题,或者某种二元的开关任务,来训练模型完成某种近似应激反应的工作?
安:对,那是一种高度简化的模型。我当时甚至算不上是在训练模型,更像是在研究它们的记忆容量。比如,这些网络能回溯重构多久以前的输入信息?几年后我终于想明白了:虽然确实可以通过循环结构,或者说发放率神经网络(firing rate neural network),来获得长时间尺度,但我认为生物学系统很可能一直都有它自己的解决办法。
大多数时候,生物系统能通过多种途径获取不同的时间尺度,比如分子信号过程自身的时间常数、血液中循环的激素、基因表达的时间尺度等等。所以回过头看,当时我们专注于研究储备池计算(reservoir computing),但或许正因为过于关注这个迷人的理论,我们反而忽略了生物学实际解决问题的真正机制。
保罗:这种模型虽然很酷,但会不会同时也显得有些局限和脆弱?因为你必须把参数调得恰到好处,它才能正常工作。不过我的理解是,储备池计算其实拥有相当高的表达能力,而这正是它的核心价值所在。它的做法是随机分配所有参数之间的权重,只要储备单元(units)数量足够多,你就能通过一个简单的线性读出层(linear readout)来训练它完成各种各样的任务。
然而,人们也确实要花大量时间训练这些模型,试图找出那些有效的参数组合。它们到底是本身表达能力就不强,还是说虽然潜力很大,但必须以一种非常特定的方式设置才行,以至于稍作调整就会失效?
安:我们现在已经能更稳定地训练这类模型了。我组里有一位博士后经常做这方面的工作,他此刻就在将一些循环神经网络(RNN)模型拟合到实验数据上。只要采用合适的约束条件和一些技巧,就能超越那种“小心翼翼调试神经网络”的琐碎感觉。过去10到15年里,这类模型拟合的方法确实取得了巨大的进步。
当时最困扰我的一点是,我研究的并不是真实的大脑,而是一个玩具般的模型系统。这其实是每个研究生在某个阶段都必须想清楚的问题,你真正关心的是什么?是方法本身?是理解背后的数学和动力学?还是机器学习的技术?对我而言,真正让我感到对领域有所贡献的,是能够将研究指回生物学本身,指向一个我正帮助理解的真实生物系统。
保罗:你提到了机器学习。听起来你更关注真实的生物大脑及其运作过程。那你对眼下这股神经AI(neuro-AI)的热潮怎么看?你觉得自己处在这个领域的什么位置?
安:天哪。每次听到这个词,我都得停下来想一想它的定义到底是什么。
保罗:确实也没个准数,但啥东西不都这样嘛。
安:具体指什么?是指通过探索大脑中更多的计算原理,来改进人工智能这个方向吗?
保罗:既包括这个,也包括反过来的方向吧?就是那个AI与神经科学之间美妙的、良性的循环。
安:我觉得大多数自称研究神经AI的人,并不仅仅是指“我用AI工具来分析我的神经数据”。更重要的层面是,通过研究大脑能帮助我们构建更好的人工网络。
保罗:确实是这样。
安:我认为,当前AI领域使用的网络家族(family of networks)和方法,与大脑解决问题的方式存在相当大的差异。但我们可以提出一个有力的论点:尝试理解大脑的运作机制是很有价值的,这不仅是为了在神经系统出现故障、功能失常时能够进行修复,更是为了能将那些原理应用到我们自己的计算工具中。
神经系统具备一种局部处理事务的能力,而不是依赖于中心化的、自上而下的层级控制。我觉得这种特性非常有趣,而我们现在还不太知道如何在机器学习和AI系统中真正利用好它。另外,显然还有一个能效方面的论据:理解大脑是如何进行计算的,以及这种方式与我们在GPU上运行的大语言模型的计算方式有何不同,这本身就很有意义。
我认为,把研究大脑作为推动人工系统工程进步的一种手段,是完全站得住脚的。至少我自己一直在尝试阐述这个观点。对我个人而言,理解大脑本身就是终极目标。我认为,大脑一定在使用一些现有网络所不具备的“技巧”,无论这些技巧是否仅仅源于大脑所使用的生物基质(substrate)特性。比如神经元通过大量具有固有时间常数的不同信号分子进行通信,这些机制或许是我们无法在计算机上真正复现的。但我觉得,理解其原理本身就极具价值。
保罗:你是认真的吗?敢不敢为此下注?
安:哈,算了。我可不赌。
保罗:那我下次再问你,等你再多做点研究之后。另一方面,动力系统理论当然不是凭空出现的,不过你刚才提到了戴维·苏西洛,他和拉里·阿博特合作研究储备池计算,以及你之前提到的FORCE算法。他与MONTE的建模工作,就是早期的典范之一。
通过研究机器学习或人工神经网络(artificial neural networks)所得出的原理,确实可以转化过来帮助我们理解大脑。比如,那个经过训练、能执行简单情境决策任务的循环神经网络内部的动力学特性。通过分析人工网络的动力学,我们确实有可能窥见大脑的运作机制。尽管大脑的实际运作涉及各种不同时间尺度的信号传递,使用着各种的分子和尺度等等。但我想,你一定很看重这种研究路径的价值。
安:是的。先训练一个网络去完成某项任务,然后观察它是如何学会解决这个任务的,再尝试用这个学习过程作为解读真实神经活动的一个参照框架或视角。
这正是我们解读神经活动的核心思路,比如,当我们记录到动物在执行某种复杂行为时的神经元信号后,总需要一套方法来理解。动力学系统框架是一个非常强大的工具,它帮助我们直面一个现实:许多我们手工构建的神经解读方法,比如调谐曲线(tuning curves),往往只能捕捉到神经元放电频率变异中很小的一部分。我完全同意,动力学系统框架是理解神经数据的一种高效途径。
我不确定这种方法的潜力边界在哪里,你未必能在人工网络中找到与大脑完全相同的解决方案。这可以作为一种尝试,有时能成功,有时会失败。失败的原因可能在于,你对任务的表征方式不够准确,也可能在于信息传入网络的方式,或者在抵达你试图理解的那个计算环节之前,其处理过程就存在偏差。
以皮层下结构的研究为例,我们的模型在很大程度上是抽象化的,剥离了动物的视觉场(visual field)和丰富的感官环境。我们更多是在处理那些难以预测的、缓慢变化的动机状态。如果我用一个神经网络来训练一个虚拟智能体,让它学会在夜间有捕食者出现时,做出觅食或攻击的决策,需要花费很大功夫,才能让这个智能体在动力学上达到一种可以映射到真实大脑结构的状态。
保罗:你刚才说皮层下结构的动态特性比较慢,但在应对威胁时,反应必须得非常快才行吧?比如逃跑反应的启动是一瞬间的事,而这个功能同样是由皮层下结构控制的,对吗?
安:对。具体到应对威胁,你不仅需要能快速反应,还需要反应的持续性(persistence)。比如你看到捕食者,逃跑后,即使暂时看不见它了,你也需要记住刚才看到过捕食者,并保持隐匿状态一段时间。所以关键不一定在于慢,而在于这些内部状态的动力学所具有的持续性,这在很多情况下都至关重要。
保罗:好吧,那我们回溯一下,或者说回到大脑出现之前的阶段,这是你近期涉及的研究内容。然后我们可以逐步讨论大脑的早期演化形态,也就是皮层下过程(subcortical processes),这些结构后来逐渐变得更为精细,再之后我们才演化出了大脑皮层。你把它称为什么来着?额外的装备?外部外壳?
安:是优化产物(refinement)。
保罗:就像龟壳一样,可能主要是起保护作用的。
安:没错,正是如此。而且很可能并非是必需的。
保罗:是的。我想引用你写的那篇关于神经系统演化的论文里的一句话,论文标题是《早期神经系统演化中的神经活动动力学》(Dynamics of neural activity in early nervous system evolution),其中提到:“许多我们认为是神经特有的属性,其实在神经系统出现之前就已存在。” 这正是我想探讨的你思维的源头,你是从系统动力学的层面来审视一切的。现在很多进入理论神经科学领域的人,都信奉一种“群体学说”(population doctrine)。
我们已经超越了单神经元调谐曲线,研究变得越来越抽象。虽然很多人不愿去研究离子通道(ion channels)和神经化学信号(neurochemical signaling),但你却重新回到了那个层面,并且是从系统的视角去研究。我想这就是我早先试图表达的意思,你的研究始终贯穿着这条主线。
安:是的。确实有越来越多的人开始关注神经计算中这些分子和皮层下层面的研究,虽然目前还是少数。我那篇论文的一个重要灵感来源是罗曼·布雷特(Romain Brette)一篇关于草履虫行为模式的精彩论文,他称之为“游动的神经元”。草履虫拥有感觉系统和运动效应器,能表现出复杂的行为、探索行为,撞到东西时会调整自己的路线。
所有这些功能都由一个单细胞完成。在单个细胞内部,感受器和效应器之间通过化学信号进行通信,而这些细胞内的组成部分,其实与更大型生物体内的组成部分在本质上是相同的。运动效应器虽然发生了变化,我们从鞭毛演化出了收缩组织(contractile tissue),但感觉分子,比如触觉传感器和光感受器,这些其实已经存在亿万年了。
许多相同的通道和分子在神经系统出现之前就已经存在,许多离子通道那时就有了。机械感受器和光感受器在不同生物间也非常相似。对了,通道视紫红质不就是从蓝藻来的吗?
我认为负责机械感觉的Piezo受体,在植物和单细胞生物里都有发现。这些基础组件早就存在了,因为在被神经元利用之前,它们已经承担着重要的功能。
保罗:确实,演化过程又不是像突然宣布说:“哎,我们现在需要一个神经系统了,得赶紧发明点新零件才行。”
安:是的。这些原本存在于细胞、存在于单细胞生物中的部件,在生物演化出神经系统时,就被“征用”了。我猜,是在不同的结构里实现了类似的功能。有一批学者专门思考这个问题:从单细胞生物到多细胞生物的演化过程到底是怎样的?细胞如何从彼此完全相同、只是聚集成群的状态,走向更精细的功能特化?而从特化开始,又如何一步步发展出器官、神经系统和收缩组织?
这真是个非常迷人的领域,而且我们现在对这个过程可能是什么样子,已经有了相当不错的理解。关于神经系统的起源有几种不同的理论:它最初究竟是为了控制纤毛运动,还是控制收缩组织?或者,它主要的功能是分泌信号和调节其他细胞的活动?
保罗:这是两种可能的路径,但你在论文中还阐述了第三种,即一种自发产生的内源活动,其导向是维持内部状态的稳定。我这样理解对吗?
安:对。这是我们那篇论文着力强调的一个观点,我们是通过水母这个模型来研究的,发现它们就具有非常丰富的内源活动。内源性周期活动其实很容易从很多动力学系统中产生。你所需要的,就是在相互作用的组件之间建立某种反馈耦合(feedback coupling),并且这些组件在时间尺度上要有所分离,比如一个快,一个慢。
保罗:那是否还需要一个是兴奋性的,另一个是抑制性的呢?
安:我认为即使是一个纯粹的抑制性系统也能实现。我想幽门节律(pyloric rhythm)就是这样一个例子。
保罗:我猜也是,看来关键还是取决于信号传递的时间尺度特性。
安:没错。相互作用组件之间存在时间尺度差异,这一点最为关键。这种特性不仅很容易实现,而且可能很有用。周期性活动遍布身体的许多部位。拿水母来说,它参与吞咽和消化,它还参与游动,还包括昼夜节律,可能还包括激素释放的周期性信号,以及像血管收缩这样的信号。胰岛素释放细胞的阵发性分泌就是一个有趣的例子,许多系统内部确实都存在这类振荡器(oscillators)。
支持这一观点的一个重要论据是:当你需要将一个信号从一个区域传递到另一个区域时,你可以采用幅度调制(amplitude modulation)的方式,也就是向下游受体发送一个固定浓度的配体(ligand);或者你也可以采用频率调制(frequency-modulating)的方式。
如果你采用幅度调制,而信号中又存在任何噪声,那么你根本无法将噪声与你试图传递的幅度信息区分开来。但如果你用脉冲来通信,那么即使上面叠加了一点白噪声,也不会干扰你对这些脉冲频率的检测。振荡器很可能是早期神经系统的一个特征,并且对多种生物功能都非常有用。
保罗:人们总在讨论大脑的用途:控制运动、感知环境、维持生存、调控发育。
安:比如控制激素释放的时机。
保罗:你指的是振荡本身的作用对吗?
安:不,我指的是像变态发育(metamorphosis)这样的过程,比如决定何时化蛹并羽化成成虫。这些关键的生命事件都是由神经系统调控的。还有青春期的启动,也受神经系统控制。这说明大脑的功能远不止支配行为。
保罗:确实。这正好反驳了“大脑仅用于行为”的观点。虽然这些目前还只是理论推测,但确实可以提出一个有力的论点:大脑的核心功能在于调控发育、维持内环境(internal milieu)以及管理信号传递。而你指出的关键在于:振荡现象很容易产生,并且是传递这类信息的绝佳方式。单从这一点来看,振荡就非常重要,内源性自发活动在神经系统出现之前就已然举足轻重。
如今,像厄尔·米勒(Earl Miller)这样的学者提出了“认知即节律”的观点。他认为一切认知活动都构建在振荡之上,是自下而上贯穿始终的,对吧?最近有一篇研究皮层网络的论文,我不确定是否也包含了皮层下结构(subcortical stuff),他们利用功能性磁共振成像(fMRI)发现,不同子网络之间存在这种转换,而且这种转换本身就是节律性的、有节奏的。它是按照周期、通过振荡的方式,流经这些共同的过渡状态。所以,振荡是那个从底层一直贯穿到顶层的机制吗?认知本质上就是一种节律?这是你认同的观点吗?
安:是的。不过我从未真正深入研究过人类数据或脊椎动物数据中的振荡现象。我经常困惑,如何将那些从脑电图(EEG)信号中提取出的那些振荡,实实在在地对应到神经元的具体活动上。但我认为,神经信号的频率维度非常值得深入思考。举个例子,我最近刚和林倩(Lin Qian)聊过她对血清素能信号(serotonergic signaling)的成像工作。
她研发了用于检测细胞外神经调节(extracellular neuromodulatory)和肽能信号(peptidergic signals)的光学传感器,并以此观察血清素信号的不同频率特征。结果清晰显示出,血清素存在高频波动和浓度变化,同时也存在中低频的振荡。血清素的受体家族中,其中的一些受体对其相应确实具有低通滤波响应特性(low-pass filtering)。它们需要与血清素结合足够长的一段时间,才能真正有效地触发下游的信号传导级联。
这正是我和我的博士后目前正探讨的问题:频率空间中的信号分离,是不是一个我们应该重视的方向?它可能会影响不同脑区之间的信息交流。甚至,它可能也会影响神经网络的发育。如果你有一套在特定时间尺度上运作的可塑性规则,那这些规则就会允许特定频率范围内的活动去塑造突触权重,同时过滤掉其他频率范围的活动。
我不确定不同的脑区是否会使用特定的频带(frequency bands)来相互通信,这超出了我的研究领域。但神经活动所具有的这个时间维度组件,确实是一个需要时刻牢记在心的重要方面。
保罗:时间维度(temporal aspect)确实是所有AI系统一个明显的缺失,AI系统里根本没有真正的时间机制。是吧?
安:没错。除非是做机器人学(robotics),需要闭环控制(closed-loop control),但这类需求在我们通常讨论的那些AI系统里往往不在考虑范围之内。
神经调控的“旋钮”:
肽类物质如何塑造行为状态
保罗:但在生物系统中,时序控制是贯穿始终的,从最底层到最顶层都至关重要。这太关键了。就拿发育来说,还有战逃反应(fight or flight)的时机掌控,一切都关乎时序。我最近对这个问题特别着迷,说得有点多了。但我总是忍不住想,人工系统和自然生物系统之间最根本的区别到底是什么?哪些差异才是真正起决定性作用的?
广义上的动力学是一个方面。虽然像循环神经网络这样的人工智能系统也有动力学特性,但我所说的动力学,更侧重于指事物内在的时间节律。生物过程对时间因素都异常敏感。无论是否表现为振荡,一切活动都高度依赖于精密的时序控制。
安:是的,时序特性是生物计算中不可分割的一部分,这与深度神经网络中的计算方式完全不同。确实如此。之前有一段时间,异步计算(asynchronous computing)的概念很受关注,也就是没有统一时钟信号的计算,所有组件都在自己的时间框架下运行,不需要中央控制器来追踪计算进度。大家都在探索如何为这种异步系统设计有效的算法。
我认为,这恰恰是大脑必须面对的一个问题:所有计算都是在局部完成的。你并不总是需要全局的教学信号来指导学习规则,也没有全局时钟来决定何时从一个脑区查询信息,或者何时将信息传递给另一个脑区。时间是生物神经网络具身性(embodiment)的一部分。
另一个我认为对生物神经网络功能至关重要、并且我自己非常感兴趣的方面,就是神经元之间信号分子和信号通路的多样性。
保罗:时间特性是一个方面。你在关于神经系统演化的那篇论文中强调的另一点,是自发活动的内源性——无论是否表现为振荡或特定时序,它都像是从系统内部自发产生的。我想特别指出这一点,你可以展开讲讲吗?
安:这是针对神经系统演化领域的回应。传统上,当这个领域的研究思考行为时,大多采用刺激-反应(stimulus-response)框架,而不是将神经系统视为具有持续动态活动、更像一个连续控制问题(continuous control problem)的实体。我们试图对这一部分研究提出新的视角:神经系统的活动并不仅仅是“遇到刺激就做出反应”,而是对机体持续不断的作用,这种作用在生物体内始终存在。因此,在我们推演早期神经系统可能是什么样子的时候,必须将这一点考虑进去。
保罗:你提到了组件的异质性(heterogeneity)。在我的小型复杂性讨论组里,我们常提到那篇著名的《多者异也》(More is different)论文。不过我得小心措辞,因为你的标志性观点是“异则多”(different is more)。虽然你看起来对这个措辞不是特别满意,但它的宣传效果不错,对吧?
安:确实。那是我写作时突然冒出来的想法。这可以追溯到我最初学习储备池计算时的那种不满,当时我们似乎只依赖放电频率来解释一切,但这感觉完全不像生物系统真正的运作方式。记得在哥大读博初期,我曾向一些实验神经科学家请教:神经调节剂(neuromodulators)到底是什么?它们有什么功能?大概有多少种?
保罗:他们怎么回答的?是把问题拔高了吗?还是说他们直接避而不谈?
安:那个年代,这完全是一个巨大的未知领域。只知道有这类物质存在,但对它们的具体功能一无所知。
保罗:从我的神经科学研究经历来看,这些物质似乎总被视为有些“碍事”。给人的感觉就像是:“好吧,总有一天我们会研究它们,但眼下最重要的是神经元,以及它们放电的频率。”
安:对,还有放电脉冲(spikes)。我觉得这有点像“醉汉找路灯”的寓言——因为你能测量到脉冲,所以就试图用脉冲来解释一切,然后就此了事。最近流行构建大脑的基础模型,那种思路就好像是:你只需要记录下所有脉冲和所有条件,然后就大功告成了。但脉冲只能告诉你“有人在说话”,却无法告诉你“它们具体在说什么”。
这种观点是我在做博士后、开始钻研下丘脑时逐渐形成的,它的运作方式跟我从小到大对神经元的理解非常不同。相关文献读得越多,我越觉得这里蕴藏着巨大的理论探索空间。神经元之间的通讯方式如此多样,你实际上拥有的不是一个单一的权重矩阵,而是基于不同通讯渠道的多个矩阵。
神经调节剂(neuromodulators)和神经肽(neuropeptides)在大脑功能中的重要性是显而易见的。我们发现它们能产生一些很有趣的效应,几乎像是提供了一种“情境信号”,我们能够根据信号分子反映的机体状态,重塑神经网络的动力学特性,使其执行不同的功能。比如说,我最近做了一些关于神经肽Y(neuropeptide Y, NPY)的工作,当动物食物受限时,弓状核(arcuate nucleus)的神经元就会释放这种物质。
这些弓状核神经元会向大脑的不同区域发出投射,并在食物受限时开始释放NPY。其中有一条投射路径到达内侧视前区(medial preoptic area),它会降低生育能力并延迟青春期的启动。这就像是说:如果你正在挨饿,那可不是生孩子的好时机,最好还是再等等。
保罗:你说的这些研究都是在小鼠身上进行的吗?
安:是的。它们的热量摄入会增加,我记不清是翻倍还是变成三倍了。而在哺乳期,为了产奶,它们会流失骨骼中高达30%的钙质。
保罗:这些现象都和神经肽Y有关吗?
安:是的,这关乎怀孕和育幼,确切说是哺乳,这会给身体带来巨大的生理负担。如果你在挨饿时怀孕,情况可能会很糟糕。NPY的作用就是试图降低这种可能性。此外,我的合作者尼克·贝特利(Nick Betley)还发现,有另一群释放NPY的神经元,它们投射到臂旁核 (brachial nucleus),能够屏蔽掉很多慢性疼痛信号,比如炎症性疼痛和持久性神经痛。
食物受限的动物对这些疼痛信号的反应,与它们吃饱时的反应完全不同。即使你给小鼠的后爪注射福尔马林,引发强烈的炎症反应,但如果这只小鼠正处于饥饿状态,它就会完全无视这种疼痛,表现得就像根本没有感受到任何痛苦一样。
保罗:这背后的逻辑就是生存优先,觅食比其他事情更重要。
安:对。如果你感到疼痛,你会回到巢穴舔舐伤口、休养生息;但如果你在挨饿时也这么做,那就会死掉。所以你必须抑制这种疼痛反应,转而去执行对生存更重要的其他行为。NPY 似乎就扮演了这样的角色:优先引导动物远离某些行为,转向其他行为。
这样的例子还有很多。我的合作者莫里尔·泽利科夫斯基(Moriel Zelikowsky)发现,长期的社会隔离会驱动神经肽速激肽2(tachykinin 2, Tac2)在全脑和全身范围内上调。小鼠的抑制性中间神经元(inhibitory interneurons)和皮层中出现了Tac2过表达(overexpression)的迹象,皮层会产生某种反应,皮层下区域、脾脏和性腺也参与其中。这些被隔离饲养的小鼠也会表现得更加焦虑,对其他小鼠的攻击性也强得多。
如果对群养的小鼠在不同脑区过表达Tac2,可以单独诱发出焦虑表型(anxiety phenotype),或者单独诱发出攻击表型(aggression phenotype)。而如果在被隔离的小鼠体内阻断Tac2的过表达,小鼠的行为就会恢复正常,表现得像群养小鼠一样。这就像是基因组(genome)内置的一种,我不知道该称之为诱导性偏置(inductive bias)还是应急预案(contingency plan)。它仿佛在说明:如果你遇到特定环境,就启动这种物质的生产。而一旦启动生产,它就能以某种近乎神奇的方式,改变快速时间尺度上的计算动力学,从而调控行为。
最让我着迷的正是这一点:大脑是怎么能如此有效地自我调节的,它并非只能做一件事,而是可以执行多种不同的行为,同时系统还不会崩溃。当你被社会隔离时,你不会突然就忘了怎么识别物体。很多功能都保持正常,但某些特定行为却会发生明显的改变。
保罗:就像你冲浪时腿被鲨鱼咬掉,你依然能看清冲浪板并努力保持浮力。你根本顾不上担心腿没了,唯一的焦点就是拼命逃离险境。
安:你可能根本感觉不到疼痛,至少要到安全上岸后才会感觉到。那时你处于恐慌模式,肾上腺素飙升驱动着你行动,而不是优先去处理疼痛感。
保罗:我想再请教一下关于因果关系的观点。听起来,你指出的这些肽类物质,当它们生成时,能在保持我们部分认知功能完好的同时,对认知产生巨大影响。比如特定水平的NPY表达会抑制疼痛。
安:你的理解正确。
保罗:这听起来……虽然你刚才说系统很稳健,但这样看似乎又很脆弱?你是如何从因果关系的角度看待这一点的?我们是否应该说这是一种对功能的机械论解释(mechanistic account)?你用了肽类物质“发挥作用”这样的说法。我们是否需要从那种强硬的、一因一果的“台球式因果关系”,退回到一种更依赖情境、更柔性的因果叙事?你如何看待这种层面的因果关系?
安:是的,因果关系很复杂。或许我在描述和思考这个问题时,确实有点陷入“台球式”的思维定式了。不过,我们的扰动实验确实得到了一些结果。比如,就拿NPY的例子来说,如果你针对臂旁核内那些表达NPY受体的神经元,人为地去抑制它们,你就能得到和动物食物受限时一样的效果。
你也可以直接施加一种扰动:如果你阻断了NPY本身,你也就阻断了饥饿所引起的疼痛反应抑制。我们能够操控这些系统,并提出疑问:它们是否真的产生了我们预期的那种效应?这其实是实验神经科学中一大难点:如何真正让自己确信,NPY的释放与疼痛应对行为的改变之间,存在的是因果联系,而不仅仅是相关。
保罗:这也让我想到,神经科学现在正转向研究自然行为。你描述的这些属于类自然行为,但在一个完全真实、生态化的场景里,一只小鼠可能同时处于怀孕、饥饿和躲避老鹰追捕的状态。多种情境交织在一起。而在实验室里,我们只能让小鼠设置在在限定的环境中。
安:一次只研究一个变量。
保罗:从这个角度看,我感觉这是一种还原论的做法。
安:是的。我想我最近在评论文章里提到过这一点:从某种意义上说,你研究的是一个高维行为,小鼠可以做出任何动作,它的行为是自发的。但从另一种意义上说,比如在研究攻击性的实验中,你把一只小鼠放在它的笼里,啪地扔进另一只小鼠,观察它们10分钟,然后实验就结束了。从某种角度来看,这是一种非常低维的研究方式。
你是在一个特定环境中,用单一类型的刺激,去观察处于特定状态的动物。因此,你所研究的东西的维度,实际上取决于你关注的是大脑的哪个部分。如果我是研究运动控制的,我在“居留-入侵者”(resident-intruder)实验中能看到多种不同类型的动作。但如果你是研究动机状态的,那你关注的变异轴心(axis of variation)就相对单一。
不过,现在已经有一些研究开始关注这些动机状态之间的相互作用了。我们和尼克(Nick)合作的一个项目就是研究饥饿与疼痛之间的交互。疼痛,实际上,它不仅仅是伤害性感受,更是一种动机和情感现象。
保罗:在个体内部?你是说,在单个大脑内,不同动机状态会相互影响?
安:对。我们后续有一个项目,研究饥饿与捕食者威胁之间的相互作用,这个方向也有其他人探索。还有饥饿与攻击性之间的相互作用。大家已经开始研究这些成对的交互,试图真正逼近动物完整的感知世界。要涵盖它可能处于的所有状态,确实需要极其谨慎的设计。
保罗:这根本不可能实现啊。
安:是的,必须得非常精心地设计实验,才能收集到真正可用的数据集。
保罗:这根本不可能实现啊。
安:是啊。要收集到真正可用的数据集,实验设计必须非常精细。
保罗:要从完全生态有效的角度去回答这些问题……这就像是你想要一个完美的猫的模型,结果那个模型就是猫本身。
安:最好还是同一只猫。
保罗:无论是使用模型还是理论,你总是在进行抽象,所以永远不可能有完美的复现,你本意也并非要复制所有细节。你必须通过抽象来阐明你感兴趣的过程。我不确定是否有人真的想要完整复现动物所感知的整个世界及其所有的功能可供性。
安:在实践中,我们只能一步一个脚印。一次研究一个系统,一个项目解决一个问题,先尝试解释和理解它,然后再预测它可能如何与其他系统互动。这是一个逐步迭代的过程。
保罗:当你描述神经肽的作用及其下游效应时,因果性这个词总是和效应联系在一起,你提到这些控制信号和皮层下过程是如何依赖于情境的,它们能塑造或改变其他脑区神经活动发生的方式。
理解这一点的一种思路在于,现在不是有个“流形”(manifold)研究热潮嘛,在神经活动的低维群体研究中,什么都被看作流形,现在“子空间”(subspace)这个词也更流行了。所以我在想,当你拥有一个神经元群体和一堆不同的子空间时,这意味着不同的神经元池(pools of neurons)会根据它们自身的内部动力学特性以及所接收的输入类型,以不同的方式运作。
你是从正交群体活动(orthogonal population activity)的子空间、或者说可能流形状态中的不同流形这个角度来思考它,还是更简单地把它看作一种类似“游戏”的机制,比如全局性地升高或降低所有神经元的放电频率?
安:我认为这正是理论可以发挥作用的地方:我们需要弄清楚,当你调控一个神经元群体的活动时,其可能产生的影响范围有多大。例如,当你大量释放一种神经肽时,你是激活了一组先前不响应、现在开始响应的细胞,从而将这些新细胞招募到你的计算群体中?还是改变了全体神经元的兴奋性?
这正是理论能做出实质性贡献的方向。我们在这方面做了一些初步探索,研究了异质性神经元群体,以及调节神经元兴奋性的异质性如何改变它们作为储备池的计算方式。我的博士后理查德·加斯特(Richard Gast)正在开展这方面工作,我们给神经元添加了一种相当简单的异质性形式。我们认为,有一群发放脉冲的细胞(spiking cells),它们并非拥有相同的阈值,而是具有一个放电阈值(spike threshold)的分布。有些细胞稍微容易兴奋一些,有些则较难兴奋。
然后我们问:当你改变这个分布的宽度时,它会如何改变群体动力学?我们最初这样做只是考虑细胞类型内的变异,事实上,任何一个给定的细胞群体都不是完全相同的,它们存在一定的差异。我们和卢卡·马祖卡托(Luca Mazzucato)讨论过,他一直在思考一个非常相似的模型,用以理解乙酰胆碱对皮层动力学的影响。卢卡指出,这种放电阈值的分布实际上是可以根据某种配体的浓度实时改变的。我也同意这一观点。
如果你向皮层施加乙酰胆碱,一些细胞会去极化(depolarized),而另一些则会超极化(hyperpolarized)。你施加得越多,这个分布就变得越宽。你确实可以通过神经调节信号实时改变放电阈值分布的宽度。在理查德的工作中,他基于异质性神经元的脉冲网络,推导出了一个平均场模型(mean field model),用以描述群体的放电率及其行为。
利用这个简化后的平均场模型,他可以执行分岔分析(bifurcation analysis),观察根据输入量的大小以及群体放电阈值异质性的程度,可以将系统推入哪些不同的计算状态。这非常有意思,仅通过调节整个神经元池的放电阈值异质性,你就能对神经群体的传递函数产生相当深远的影响。
在一个兴奋性细胞(excitatory cells)池中,增加异质性可以线性化它们的响应。这使得活动具有更高的维度,更适合函数生成等任务,但会削弱同质网络(homogeneous network)所具有的那种良好的双稳态机制,而这种机制对于工作记忆等功能非常有用。
保罗:所以在高异质性状态下,系统会被推向线性区间?
安:是的,会呈现线性的输入-输出传递函数。系统维度变得更高,能够被更广范围的频率所驱动,行为库也更丰富。
保罗:这是为了提升处理能力对吧?
安:是的。
保罗:但如果异质性过高,会不会因为维度太高而导致系统无法有效工作?
安:没错。如果走向极端,就会出现一些神经元持续放电而另一些完全静默的情况。这时系统的放电阈值分布会变得非常不稳定,导致有效计算群体中的神经元大量流失。实际上,存在一个相当合理的分布宽度范围,能够产生多样化的行为模式。
保罗:所以并不是一个最佳点,而是一个最佳区间。
安:是的。调节神经元群体的异质性,就像是给系统增加了一个新的“控制旋钮”。但如果我们不是在所有神经元上,而是专门在抑制性神经元上调节这个“旋钮”,效果会截然不同。这里有一个关键点:如果一个网络里的抑制性神经元全都一模一样,就像复刻品一样拥有完全相同的放电阈值,那么这个网络就很容易陷入一种剧烈的、类似癫痫的爆发性活动模式。而反过来,如果我们增加抑制性神经元的异质性,让它们变得彼此不同,反而能“解锁”兴奋性神经元网络中固有的、复杂的动态特性(比如多种可能的状态,即“分岔结构”)。
更重要的是,如果能实时地调节抑制性神经元的异质性,我们或许就能实现一种“信息门控”的效果。调高异质性时,兴奋性神经元的动态特性(其“传递函数”)就会清晰地表露出来,允许信息更精细地传递;调低异质性时,这种精细的动态特性就会消失,系统回到简单的爆发模式。
这种机制的美妙之处在于,它提供了一种控制大脑计算的全新思路:我们不需要去精确调整成千上万个突触连接的权重,也不需要进行复杂的“监督学习”,而是通过调节细胞本身的兴奋性差异这种整体性参数,就能大幅改变网络的计算模式。这简直像是一种“开箱即用”的调控捷径。
保罗:我一直在想,皮层下过程就像是可以调节的刻度盘、旋钮之类的东西。这让我想起了麦克·夏恩(Mac Shine)几年前的工作,他和 Michael Breakspear在神经元群体的模型中,通过控制增益(gain)发现了这些无标度动力学(scale-free dynamics)特征,并且存在一些最佳的“甜点”区域,我猜这里的增益本质上就是控制放电阈值。
这让我联想到你的研究。不过在他的研究中,他是将这一机制映射到了上行唤醒系统(ascending arousal system)上。如果你通过去甲肾上腺素的投射或其他途径,来调高或调低神经元的放电阈值,你也会得到类似的那种最佳范围。虽然不是完全相同的机制,但也是一个能让系统做很多事情、具有很高容量的最佳范围。从这个意义上讲,你可以把上行唤醒系统看作一个控制旋钮。
那么所有的皮层下过程,你是否都把它们看作控制旋钮?你是怎么看待它们的?这是不是一种对皮层下过程的控制论视角?
安:是的。但我认为,这些“控制旋钮”本身到底有多高的维度(high-dimensional),还是一个开放性的问题。
保罗:那它们的维度究竟有多高呢?
安:我们有很多通讯渠道,但这些渠道能够影响突触后细胞的方式却相当有限。虽然我们有数百种G蛋白偶联受体(G protein-coupled receptors),但信号进入细胞内部后发生的变化就比较受限了。这其实很有趣,我认为这种设计是为了实现特异性。
保罗:能请你详细阐述一下吗?细胞膜上存在着许多不同类型的受体(比如G蛋白偶联受体),用于接收来自皮层下结构的输入。这看起来多样性很高,但你刚才的意思是,在细胞内部,存在着某种瓶颈,限制了后续可能发生的事情?
安:是的。在细胞内部,对于一个G蛋白偶联受体来说,其受体部分对配体(ligand)具有特异性,或者说,它有一组能够结合的配体。而在细胞内部,存在着Gα、Gβ、Gγ 这些亚基。当受体与配体结合后,这些亚基会分离,然后在细胞内各自去执行自己的任务。这里的关键在于,受体类型的数量远远多于亚基的类型。一旦你激活了这些亚基,它们中的大多数最终都会汇聚到调节细胞内环磷酸腺苷(cyclic AMP, cAMP)的水平上来。
保罗:为什么会需要这种维度缩减呢?
安:这是个很好的问题。首先,这种维度缩减的程度究竟有多大,本身仍然是一个待探索的问题。比如环磷酸腺苷(cAMP )在细胞内是像一个均匀混合的池子,还是存在不同的区室,让不同区域的 cAMP 可以独立运作?这和钙离子信号一样:生物学中几乎所有事情都通过钙离子传递,那我们是如何用同一种离子来分别调控动作电位、转录和其他所有过程的呢?是否存在功能分区?
这一直让我很困惑:生物系统拥有如此复杂的能力,却都要挤过细胞内钙离子这个狭窄的瓶颈。
至于受体多样性,演化生物学中有一个概念叫做大野悖论(Ohno's dilemma),说的是:如果你有一个负责功能X的基因,而你又需要它去承担功能Y(当然演
但在不破坏 X 的前提下突变出 Y 是很难的。于是演化的策略是:复制这个基因,然后对复制品进行突变。也许让这个副本在大脑的不同区域表达,也许改变它对某个配体的结合亲和力,或者干脆让它完全转向偏好另一个不同的配体。
保罗:你指的是演化过程的作用,还是在个体生命周期内的变化?
安:演化。这是一种利用现有有用结构的策略,比如一个细胞表面受体(cell surface receptor),通过扩展其连接范围来增加功能多样性。虽然调用的是相同的下游信号通路,但通过在不同细胞亚群中激活该受体,就能以不同的激活阈值或时间尺度实现功能分化。
我们发现血清素、乙酰胆碱有数十种受体,许多神经肽也至少存在数种受体亚型。这可能是实现特异性的方式,确保特定细胞亚群能精准接收信号。而一旦信号传递至细胞内,后续的处理机制则是相当一致且保守的。我所希望阐明的观点是:虽然表面上看起来像是一团生物学的“乱麻”,但实际上你用来调控细胞的手段,其变化范围是相对较小的。
保罗:这确实是个复杂的生物混沌体系,令人头晕目眩。幸好有你这样的学者投身其中,我的大脑最多只能记住三个缩写词,超过这个数就不行了。神经肽的世界,我根本不知从何入手。
安:但其实没必要搞得那么复杂。本质上,这就是你的权重矩阵中哪些条目是非零的问题。这样一来,这个细胞就能与那个特定的细胞亚群进行通信。而一旦通信建立,这些细胞后续会做什么,其实是高度受限的。这再次说明,这是一种将连接性“预置”到大脑中的方式,无需通过经验来学习。
打个比方:如果我有一组细胞能释放某种特定分子,而另一组细胞可以“聆听”这种分子,那么我就能在这两个群体之间形成一种交互作用,而不需要以某种非常精确的方式去引导一个轴突连接到树突。如果我再让这种信号分子的表达对动物的状态敏感,比如对食物短缺、社会隔离或应激敏感,用演化生物学的语言说,叫做表型可塑性(phenotypic plasticity)。你会得到一些表型,它们就像是应急预案,就像大脑中的一些神经回路和交互模式,只在你需要的时候才被激活。
保罗:就像是即时生成的。这是不是部分印证了你在评论文章里的观点:理论神经科学还有巨大的发展空间?传统上理论神经科学把大脑视为执行任务的符号计算过程,但你的研究真正把它带入了一个全新的维度:自然情境。就像整个领域正在推动的研究方向一样,将其置于生态效度更高的行为研究中。
此外,你的研究还在跨层次,一直深入到亚细胞过程,探索这些亚细胞通讯与信号网络的运作方式。这是否就是你所看到的、理论神经科学最具发展潜力的方向?
安:这确实是其中一个方向。这里存在着巨大的理论构建和假说生成的空间。比如说,这些信号系统应该以何种方式被组织起来?以弓状核(arcuate nucleus)为例,它似乎就采用了一种“枢纽-辐射”(hub-and-spoke)式的结构。当你饥饿时,它会向不同的目标脑区发出不同的投射,以此来调控相应的功能。
保罗:弓状核是什么结构?
安:弓状核是饥饿激活神经元的聚集区,这些神经元负责释放神经肽Y(neuropeptide Y, NPY)。它是大脑中的一个信号广播中心,向多个脑区传递信息。但“这是不是系统唯一的组织方式呢?”如果我们看速激肽2(Tachykinin-2, Tac2)系统,情况就非常不同。在社交隔离的动物中,表达Tac2的细胞分布非常广泛,实际上所有的抑制性中间神经元都在产生它,所以根本不存在一个单一的信号发射枢纽。这更像是基因在不同细胞群体中、可能在不同情境下被选择性激活的结果。
这让我们有充足的空间来思考:到底是什么原则在塑造这些系统?如果我们想让自己构建的神经网络变得更灵活、更具表现力,该如何最优地利用这些机制?更重要的是,如何在使用这些机制的同时,不破坏神经网络最基本、最核心的功能?
保罗:你提到了“原理”这个词。那么这些原理会不会是同一套呢?我有点犹豫要不要再回到动力学系统的视角,动力学系统理论可以应用到任何由相互作用部件组成的网络。这既适用于我们神经科学领域的传统研究对象,比如脉冲神经网络,也适用于分子网络(molecular networks)、亚细胞蛋白质相互作用网络(subcellular protein interaction networks)等等。这些系统会遵循相同的原理吗?还是说,随着我们观察的层级不同,会出现一套全新的原理?
安:是的,我认为即使我们研究的是这些非常分子层面、亚细胞层面(molecular, subcellular)的东西,我们仍然可以思考如何在环路尺度(circuit scale)上应用它们的原理。举个例子,在我和尼克·贝特利(Nick Betley)即将发表的工作中,就研究了这种饥饿对疼痛的抑制效应。
当你饥饿时,会释放神经肽Y(neuropeptide Y, NPY),它阻断了疼痛。你可以从计算的角度提出问题:这里到底发生了什么?我们是否应该这样理解?
我们最初研究这个现象时的思路是这样的:当动物对疼痛做出反应时,以小鼠为例,它们会消耗能量,比如僵住或者舔舐伤口。这些行为取代了其他活动,比如觅食。如果你处于饥饿状态,也许大脑中有一个部分在比较你的饥饿程度和疼痛程度,然后根据这些相对水平做出决策。当你更饿的时候,“饥饿值”就更高。这可以是一种理解方式:这个信号输入了某种“比较器”,由它来决定该做什么。
保罗:你认为机制真的这么简单吗?
安:这确实是我们刚开始研究时期望能验证的模型。但你也可以想象它完全以另一种方式运作。比如说,大脑中负责运动控制的部分可能会发出指令:“我受伤了,需要舔舐伤口,停止觅食。”而饥饿信号可能只是直接切断了这个指令的输出。它就像在说:“现在有其他更重要的事。暂时不要启动这些运动程序,你还有别的事情要做。”这种解释听起来也挺合理的。
保罗:就像一个中止信号。
安:对。还有一种可能性是,你或许可以从一开始就阻断疼痛信号传达到大脑。NPY 可能将疼痛信号“拒之门外”。这样的话,即使大脑有一套决策“策略”,也就是那个决定下一步该做什么的、抽象的分布式处理过程,如果大脑从一开始就不知道疼痛的存在,它就会直接去处理其他事情。为此,我们构建了一个简单的强化学习智能体(toy RL agent)模型,它包含疼痛状态、消耗状态和策略模块。然后我们追问:“饥饿到底应该调控其中的哪个环节?”
结果发现,唯一能真正复现这种疼痛应对行为减弱的,就是阻断系统的输入。另外,因为疼痛输入本身具有持续性,如果你只是提高开始响应它的阈值,系统会延迟几秒钟才作出反应;或者,如果你增加行为成本或阻断行动输出,系统就会开始不断重复尝试那个动作,直到有一次成功为止。
与直接控制策略或输出相比,对输入进行门控是控制我们系统行为的一种更简洁的途径。而且,这种方法对动物实际感受的预测也不同:因为如果我们在模型中阻断运动输出,动物实际感受到的疼痛其实比饱食状态下更强烈。
保罗:这是通过行为观察得出的结论,对吗?
安:不,不是通过行为本身。行为表现看起来是一样的。但如果你去观察在决策过程中起作用的那些内部变量,比如疼痛感和能量消耗,你会发现,在动物最终做出行动之前,其疼痛感会攀升到一个更高的水平。如果我们去干扰决策策略本身,也会出现同样的情况。这基本上等于在说:“你必须承受更强的疼痛,才会采取行动。” 所以,当你看到一个行动时,它实际上反映了更强烈的潜在疼痛。而相反,如果是通过门控机制阻断输入,那么动物实际的潜在疼痛状态反而是更低的。
当尼克观察臂旁核神经元时,他发现有一些细胞,在饱食的小鼠处于炎症性疼痛状态时,会表现出这种持久的、持续的活动;而这些活动在食物受限的动物身上就完全消失了。这确实看起来就像是疼痛感知的神经基础。当然,我们在论文里没敢把话说得这么满。
保罗:我原以为是C纤维(C-fibers)负责传递痛觉信号。难道不应该是C纤维吗?
安:你描述的那个过程是伤害性感受(nociception)。伤害性感受和疼痛(pain)是两个不同的概念。
保罗:是的,我明白了。
安:正因如此,我们现在可以说:“瞧,我们可以研发一种新药,并且通过观察这群特定的神经元活动,就能判断出动物正在经历多大程度的疼痛。我们不再需要仅仅依靠观察它的行为,或者非得在它爪子上扎一下才能知道它是否感到疼痛。” 这实际上对慢性疼痛治疗领域有着巨大的意义。因为我们第一次拥有了这种疼痛状态的神经表征基础,而在此之前,我们只能通过对动物施加某种刺激才能间接读取这个信息。一个正在经历慢性疼痛的人,并不是说你用针扎他一下他喊“哎哟”才叫疼痛,他们每时每刻都在感受着疼痛,即使他们没有用语言或行为表达出来。
保罗:这让我想起心理学中关于改变习惯的研究:最有效的方法是从源头切断。有效改变习惯的方式是针对“线索-反应-奖励”这个循环:比如说毒品成瘾,线索会触发渴求反应,吸毒后获得快感。消除线索是最有效的策略。就像告诉戒毒的人:“别去桥下买海洛因了,干脆远离那座桥。” 在神经层面,我们讨论的也是同一种原理。
安:是的。这似乎可能是一个普适性的机制。还有其他案例也表明,动物行为的改变与感觉信息处理方式的变化有关。例如,凯瑟琳·杜拉克(Catherine Dulac)在雄性小鼠对幼崽的指向性攻击方面做了非常精彩的研究。雄性小鼠通常有杀婴行为(infanticidal),如果它们遇到一只幼鼠,它们会攻击它。但是,如果它们在交配后大约一个妊娠周期时遇到幼鼠,这意味着那只幼鼠有可能是它们自己的后代,它们的行为就会发生转变,表现出更多的抚育行为,而不是直接攻击幼崽。
这种行为转变与它们如何处理来自幼崽的感觉线索,特别是与信息素线索的变化有关。当我刚开始研究这个领域时,我曾认为下丘脑就像个总决策器,它在权衡各种因素,然后在特定时刻做出要做什么的决定。那里发生着一些神奇而复杂的过程。但也许,改变行为最有效的方式,并不是去改变这些内在驱动力或需求状态之间的相互作用,而是改变你感知周围环境的方式。
保罗:你的核心观点是不是:关键并不在于下丘脑内部各种驱动力状态之间的相互作用,而在于系统对感觉状态的反应方式?
安:是的,至少在我们研究饥饿与疼痛的案例中,情况就是这样。我们发现,相比于试图去操纵其内部策略或输出,通过改变我们那个小小的强化学习智能体的输入,来改变它的行为要容易得多。
保罗:稍等,想询问一下,下丘脑以什么功能著称?传统上,我们认为下丘脑主要负责哪些功能?
安:下丘脑的功能非常庞杂。有些学者研究它在生长发育、青春期以及控制激素释放中的作用。有些研究者关注它在摄食和新陈代谢调节方面的功能。此外,下丘脑的某些部分还参与诸如捕食者防御、繁殖行为和攻击行为等过程。总的来说,它位于大脑的非常深层的区域,是由一系列相互连接的核团成的集合体。这些核团表达各种各样的信号分子和受体,而它们的核心功能似乎就是参与调控各种生存所必需的行为。
保罗:这正是我想探讨的,我想了解你对皮层下过程之间联系的看法,也就是你所研究的这些生存行为、疼痛、动机、饥饿等等。这些过程传统上被认为是一种基础层级的认知,甚至几乎算不上是认知。它更像是一种“在需要时就会自动接管”的机制。
人类和一些哺乳动物最奇妙的一点在于,我们能够进行思考。这就是我们大脑皮层的功能。我们拥有美妙的思维过程,能够想象各种场景,在脑海中模拟,并且构建世界模型,等等。然而,这些更底层的皮层下过程、皮层下结构,对我们的行为有着如此强大的影响力,它们持续地影响着我们正在进行的、实时的行为。
打个极端的比方,如果我的腿被鲨鱼咬掉了,我的视觉感知可能仍在工作,我还能看见我的冲浪板,但在那种时刻,我脑子里大概绝对不可能还在琢磨着写诗。这些高级认知功能基本上都停止运行了。你是如何看待这种跨越了我们通常所认为的“认知”全谱系的现象的?
安:我觉得可以把它看作一种针对你自身需求的“工作记忆”。它持续地追踪:我现在有多饿?有多渴?压力有多大?最近有没有打过架?周围有没有其他人让我感到紧张、或者我想去见、想去互动的?
具体机制我也说不准。但它更多是为我们的行动提供信息,而不是直接下达命令。
保罗:你的意思是,我们可以主动覆盖这些信号的,是吗?
安:是的。有个非常有意思的案例,苏格兰有一位女性,天生就感觉不到疼痛。她的脂肪酸胺羟化酶(fatty acid amine hydroxylase)基因发生了突变。
保罗:好神奇。
安:她不仅感觉不到疼痛,还说自己从未体验过愤怒或恐惧,整个人处于一种极度冷静的状态。这个基因是在下丘脑中表达的,所以她依然是一个健全的人,但她缺乏那种持续存在的驱动力。比如你我都会体验到的那种攻击性和焦虑相关的驱动力,这些好像在她身上被强烈地抑制了。我推测,可能因为这个基因突变降低了她下丘脑提升活跃度、产生持续放电和维持持久动机状态的能力。
保罗:她在其他方面完全正常吗?她不是什么特别的天才诗人之类的吧?我的意思是,她的智商和认知功能等等都正常,对吗?
安:对,完全正常,只是异常地冷静。她生过孩子,当时的反应就像是:“这感觉有点怪。” 她能识别出别人正处于痛苦或困境中,但对她来说,这更像是一种认知上的判断,缺乏那种本能的“感同身受”。受影响的主要是情绪层面,而不是她的思维能力和行动能力。
保罗:这让我想到整个具身认知(embodied cognition)运动,以及所谓的“4E认知”(the four Es)。这个学派的核心观点是,我们的认知是与身体紧密相连的,我们不应该把大脑看作是独立于身体之外的,也不应该认为认知仅仅是由大脑产生的,因为我们所做的一切,都是这个与身体相连的同一系统的一部分。
你的研究似乎非常贴近这种“身体内发生的事”,也就是身体如何发出信号,让这些脑区释放出各种肽类物质,从而影响我们正在进行的行为和认知。那么,在这个脑与身体是二元对立还是非二元的问题上,你站在哪一边?
安:这是一个非得二选一的二元论问题吗?我必须选一边站?
保罗:不,我的意思正是,也许它根本就不是二元对立的。坚就像 4E 学派认为的那样,大脑和身体之间根本没有界限。
安:是的。我想说,下丘脑就处于一个非常特殊的位置。大脑中有一个区域的血脑屏障比较薄弱,使得大脑能够直接感知血液中的信号,而下丘脑正好就坐在那个位置上。
保罗:哦,这一点我之前还真不知道。
安:它能接收大量来自血液的信号,这些信号是无法到达大脑其他区域的。我认为它尤其参与诸如饥饿、口渴和感知营养需求状态这类过程,同时,它也能让你感知到循环激素(circulating hormones)以及其他物质。
脑与身体的相互作用是当前一个非常热门的话题,但它也是过去神经科学理论涉足不多的一个方向。回到之前提到的储备池计算,身体其实是一个绝佳的载体,用来承载记忆、提供能够影响神经计算的长时程信息。你有各种循环信号,它们代表着身体的整体状态、可用的营养物质,还有关于过去身体活动的信号,这些都能从身体传递到大脑,来表征某些特定的需求状态。
我认为,下丘脑的角色,在某种程度上,就是感知这些信号,推断出需求状态,然后利用这个信息向大脑的其他部分进行“广播”,告诉大家“我现在应该优先处理什么事情”。我是不是该多关注食物的气味?我是不是该多留意一下我周围的其他同类?
量化行为与理论前沿:
从基准数据集到行为预测
保罗:你另一部分的工作涉及行为建模,你可以也谈谈这方面的进展吗?如果我没理解错,你也准备发布一个数据集,对吗?
安:对,很快会发布。我最初参与这项工作,其实是因为我所在的博士后实验室想要实现小鼠行为标注的自动化。因为当你研究社会行为以解读神经活动时,你必须确切地知道小鼠在做什么。在我刚开始的时候,这项工作完全依赖于非常有耐心的博士后或技术员,他们得一遍遍地观看小鼠互动的视频,然后逐帧手动标注它们的行为。我想现在很多实验室仍然是这样做的。
最初,这纯粹是为了让行为学研究变得更轻松。我们花了一段时间研究用于姿态估计和监督式行为分类的计算机视觉系统。从“为科研工作者减负”这个角度来说,这仍然是我们感兴趣的方向。但我认为,除此之外,通过更定量化的计算方式来研究动物行为的动力学,本身也能让我们学到很多东西。显然,这个领域在过去十年里取得了爆炸式的发展。
保罗:确实,现在已有了各种各样的自动化标注工具。
安:是的。但在几年前,我们遇到一个问题:当时每个发表行为分类或无监督行为分割论文的团队,都会构建自己的内部数据集,然后证明他们的方法在这个数据集上效果非常好。但这样一来,其实没有人能够真正客观地评估这些方法的普适性到底怎么样。
保罗:确实如此。
安:我在加州理工学院的合作者皮埃特罗·佩罗纳(Pietro Perona),长期以来一直有为他所在的计算机视觉和机器学习领域发布基准数据集的传统。他的学生李飞飞(Fei-Fei Li)发布了ImageNet,彻底改变了计算机视觉领域。我们也想做类似的事情,为行为神经科学领域发布基准数据集。为此,我们组织了一系列多智能体行为挑战赛,让参赛团队去解决小鼠行为数据集中某些特定的计算问题。
第一个挑战赛的内容,和我们那篇小鼠行为论文里做的工作一样。我们发布了一个关于互动小鼠的运动追踪数据集,然后对大家说:“请为我们制作一些分类器,要能检测出动物何时在嗅探、交配或打斗。”结果发现,当你有足够的训练数据时,模型在这项任务上的表现已经可以做到和另一个人类标注者不相上下了。
我们在2022年左右发布了第二个数据集,这次的目标是无监督行为分析和表征学习。评估一个无监督模型的好坏是非常困难的,当你得到行为轨迹的分割结果时,只能感叹“哦,挺酷的”。
保罗:你的意思是,不用人工标注全部数据就能进行评估?
安:是的。关键在于这个行为的表征是否真的有用?如果你在无监督分割上做得不好,你得到的聚类可能仅仅对应于小鼠在笼子里的位置,因为你没有控制它的位置变量。
保罗:而你关心的并不是位置。你关心的是它正在做什么行为,无论它在哪儿。
安:正是如此。
保罗:不过,至少在某些实验设置中,位置信息有时也确实重要。
安:确实,“有用”的界...
热门跟贴