近日,美国麻省理工学院厄尔·K·米勒(Earl K. Miller)团队和合作者构建了一个多尺度仿生大脑模型,精细模拟了大脑皮层和纹状体的电路连接和活动。
这个模型的亮点在于:它从未见过任何真实的猴子大脑数据,仅仅依靠一致的神经生物学知识构建而成,却不仅能像猴子一样学习分类任务,还自发地产生了一种前所未有的神经信号模式。
当研究团队回头去检查真实猴子的脑电数据时,竟然真的找到了这种信号。这意味着,这一发现能为我们理解大脑如何学习、决策,甚至预测自身错误打开全新的窗口。
学会分类:数字大脑 vs 真实猴子大脑
本次数字大脑要完成的任务和猴子在实验中做的一模一样:看屏幕上由圆点组成的图案,在图案消失之后等待一会,然后通过向左或者向右扫视来报告它认为图案应该属于哪一类。选择对了会得到模拟的奖励也就是多巴胺信号增强,选择错了则没有奖励。
关键在于,模型没有任何先验知识。它不知道圆点图案是什么,也不知道左右扫视代表什么。它接收的只有像素点转换成的输入电流,以及行为选择后的奖励反馈。通过模型内部遵循生理规则的突触可塑性,它开始进行学习。
结果显示:这个纯粹的由生理机制驱动的模型,竟然以与真实猴子相似的速度学会了分类任务,它的行为准确率随着试验次数逐渐上升,最终稳定在 80% 左右,与猴子的学习曲线高度吻合。
不仅如此,当研究团队比较模型产生的神经活动和猴子大脑记录的电信号时,发现了更多对应关系。比如,在需要保持工作记忆的延迟期,模型和猴子的大脑都显示出皮层和纹状体之间在特定节律上的同步性增强。这种脑区间的节奏同步,很可能就是大脑在脑子里握住信息不放的秘诀。
在模型经过大量学习之后,研究人员仔细分析了前额叶皮层兴奋性神经元的活动,发现了一个奇特现象。每个神经元都对四种特定情况之一有着强烈偏好:A 类刺激-反应正确、A 类刺激-反应错误、B 类刺激-反应正确、B 类刺激-反应错误。前两种偏好即对于正确反应的偏好是意料之中的,符合强化学习的逻辑,即正确的选择带来奖励,强化了导致这一选择的神经连接。
但是,后两种偏好即对于错误反应的偏好则显得非常奇怪,这些神经元会在看到 A 类或 B 类刺激后的最初 200 毫秒内就显得异常活跃,而此时距离动物做出错误的反应还有超过 1 秒钟的时间。
这意味着这些神经元在错误行为发生之前,就已经预言了这次错误。基于此,研究人员将它们命名为不一致神经元。
在模型中,大约 20% 的神经元表现出这种不一致特性。它们之所以会导致错误,是因为它们更强烈地激活了纹状体中负责选择相反类别动作的细胞。就好比尽管在选择错误答案之前得到了提醒,但由于当前的主流程即由大多数一致神经元主导的力量太强,还是让模型做出了错误选择。
从模型到现实:预言被证实
那么,这个来自于纯模拟的模型,是不是只是一个人工产物?为了进行验证,研究团队使用同样的分析方法,去检查早已收集好的、经过长期研究的猴子大脑神经元记录数据。
结果发现:在真实的猴子大脑中,他们也找到了具有不一致神经元特性的细胞,这些神经元同样能在早期就预测出即将发生的错误选择。统计检验表明,使用这些神经元来预测错误,其效果显著优于随机选择的神经元。
更有意思的是,研究团队在模拟中做了一个思想实验:如果有一个神经假体设备能够实时监测这些不一致神经元的活动,一旦检测到它们强烈激活就发生了错误,那么就立刻中断这次试验,不让错误选择有发生的机会,那么会怎么样?模拟结果显示,这种干预能够显著提升任务的整体准确率。
总的来说,这种高度仿真的多尺度脑模型或许能让人们在模型中进行更安全、更便捷的虚拟实验,比如模拟特定神经递质受体的药物阻断效果,再比如模拟帕金森病中多巴胺能神经元丧失的后果等,从而能够帮助人们深入理解疾病机制以及筛选潜在疗法。此外,通过模型预测出来的一些新现象,反过来又能指导真实的实验,加速科学发现的进程。
参考资料:
相关论文 https://www.nature.com/articles/s41467-025-67076-x
运营/排版:何晨龙
热门跟贴