本周主要内容:语言模型线性表征变化、脑启发的多智能体记忆、嵌入检索系统综述、AI 自主科学发现、一般智能的网络架构、人脑的可压缩性、生命周期中的高幅事件、视觉意识
AGI 每周速递
[1] 语言模型中的线性表征可以在对话过程中发生巨大变化
标题:Linear representations in language models can change dramatically over a conversation
链接:https://www.arxiv.org/abs/2601.20834
作者:Andrew Kyle Lampinen, Yuxuan Li, Eghbal Hosseini, Sangnie Bhardwaj, Murray Shanahan
单位:Google DeepMind
摘要:
语言模型的表征中常存在对应高层概念的线性方向。本研究聚焦于这些表征的动态特性:探究在(模拟)对话过程中,表征如何沿这些维度演化。研究发现,线性表征可在对话过程中发生剧烈变化:例如,在对话初始阶段被表征为事实的信息,在对话结束时可能被表征为非事实信息,反之亦然。这些变化具有内容依赖性:对话相关信息表征可能改变,而通用信息则通常保持稳定。即使对于从表层响应模式中分离出事实性的维度,这些变化依然稳健,且在不同模型家族及模型各层中均有出现。表征变化并不依赖于在线策略对话,即使重播由完全不同的模型编写的对话脚本也能产生类似变化。然而,若仅在上下文中插入明确标注为科幻故事的内容,其适应效应则显著减弱。研究还表明,沿表征方向进行调控在对话不同阶段可能产生截然不同的效果。这些结果与以下观点一致:表征的演化可能是模型响应对话所暗示的特定角色而发生的适应性调整。本研究结果可能对可解释性与调控研究构成挑战——特别是它们暗示,对特征或方向采用静态解释,或使用假定特定特征范围始终对应特定真值的探针,都可能产生误导性结论。然而,这类表征动态现象也为理解模型如何适应上下文提供了令人兴奋的新研究方向。
[2] BMAM:脑启发的多智能体记忆框架
标题:BMAM: Brain-inspired Multi-Agent Memory Framework
链接:https://www.arxiv.org/abs/2601.20465
作者:Yang Li, Jiaxiang Liu, Yusong Wang, Yujie Wu, Mingkun Xu
单位:广东智慧科学与技术研究院、东京科学大学、香港理工大学
摘要:
基于语言模型的智能体在长期交互过程中持续面临两大挑战:难以保持基于时间的信息持久性,以及无法在跨会话中维持行为一致性——本文将这种失效模式称为「灵魂侵蚀」。本研究提出 BMAM 架构(Brain-inspired Multi-Agent Memory),一种受脑启发的多智能体记忆体系,该架构将智能体记忆建模为一组功能专门化的子系统,而非单一非结构化存储模块。受认知记忆系统启发,BMAM 将记忆分解为情景记忆、语义记忆、显著性感知记忆及控制导向记忆等互补时间尺度运作的组件。为支持长程推理,BMAM 沿明确时间线组织情景记忆,并通过融合多源互补信号实现证据检索。在 LoCoMo 基准测试中,BMAM 在标准长程评估设置下达到 78.45% 的准确率,消融分析进一步证实受海马启发的情绪记忆子系统在时间推理中起关键作用。
[3] 检索系统框架的分类学:陷阱与范例
标题:Taxonomy of the Retrieval System Framework: Pitfalls and Paradigms
链接:https://www.arxiv.org/abs/2601.20131
作者:Deep Shah, Sanket Badhe, Nehal Kathrotia
单位:谷歌
摘要:
设计嵌入检索系统需要在效率与效能之间的复杂权衡空间中进行决策。本研究将这些决策系统化为对系统设计栈的垂直分层梳理。从表征层出发,研究首先考察损失函数与架构设计(特别是双编码器与交叉编码器)如何定义语义相关性并决定几何投影特性。接着分析粒度层,评估原子式与层级式分块等分段策略如何缓解长上下文文档中的信息瓶颈问题。进入编排层,研究探讨超越单向量范式的多元方法,包括层级检索、智能体分解与多阶段重排序流程,以突破容量限制。最后聚焦鲁棒性层,通过识别架构优化方案应对领域泛化失效、词汇盲区及因时间漂移导致的检索质量隐性衰减等问题。通过对这些局限性与设计选项的系统归类,本研究为实践者提供了一套优化现代神经检索系统效率-效能前沿的综合框架。
[4] Idea2Story:将研究概念转化为完整科学叙事的自动化流程
标题:Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives
链接:https://www.arxiv.org/abs/2601.20833
作者:Tengyue Xu, Zhuoyang Qian, Gaoge Liu, Li Ling, Zhentao Zhang, Biao Wu, Shuo Zhang, Ke Lu, Wei Shi, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Harry Wang, Kris Chen
单位:AgentAlpha
摘要:
基于大语言模型的自主科学发现近期取得显著进展,展现出对端到端研究流程的自动化能力。然而,现有系统主要依赖以运行时为中心的执行范式,需要反复在线读取、总结与推理大量科学文献。这种即时计算策略导致高昂计算成本,受限于上下文窗口约束,且常引发脆弱的推理与幻觉现象。本研究提出 Idea2Story——一种面向自主科学发现的预计算驱动框架,该框架将文献理解从在线推理转向离线知识构建。Idea2Story 持续收集经同行评审的论文及其评审反馈,提取核心方法单元,组合可复用的研究模式,并将其组织为结构化方法知识图谱。在运行时,未明确化的用户研究意图将与已确立的研究范式对齐,从而实现对高质量研究模式的高效检索与复用,而非开放式生成与试错过程。通过将研究规划与执行过程锚定于预建知识图谱,Idea2Story 缓解了大语言模型的上下文窗口瓶颈,大幅减少了对文献的重复运行时推理。定性分析与初步实证研究表明,Idea2Story 能够生成连贯、方法学依据充分且新颖的研究模式,并在端到端环境下产出多项高质量研究示例。这些结果表明,离线知识构建为可靠的自主科学发现提供了可扩展的实用基础。
意识科学 每周速递
[1] 人类连接组中一般智能的网络架构
标题:The network architecture of general intelligence in the human connectome
链接:https://www.nature.com/articles/s41467-026-68698-5
作者:Ramsey R. Wilcox, Babak Hemmatian, Lav R. Varshney & Aron K. Barbey
单位:圣母大学、石溪大学
摘要:
网络神经科学的进展对将一般智力归因于单一脑区或网络的传统观点提出了挑战。网络神经科学理论提出,一般智力源于大脑全局网络架构的协调活动。本研究基于人类连接组计划中 831 名健康青年数据,通过联合建模大脑结构拓扑与内在功能协变模式,捕捉其全局拓扑组织特征。研究证据表明,一般智力(1)涉及多个网络,支持分布式加工原则;(2)依赖微弱的长程连接,强调高效且全局协调的网络特性;(3)调用负责协调网络交互的脑区,支持模态控制在驱动全局活动中的作用;(4)依托小世界架构实现全系统通信。这些结果推动了对一般智力的理解从主流的局部化模型转向基于人类连接组全局拓扑结构的理论框架。
[2] 量化人脑的可压缩性
标题:Quantifying the compressibility of the human brain
链接:https://www.pnas.org/doi/abs/10.1073/pnas.2531115123
作者:Nicholas J. Weaver, Joshua Faskowitz, Richard F. Betzel, and Christopher W. Lynn
单位:耶鲁大学、印第安纳大学、明尼苏达大学
摘要:
在人脑中,神经活动的允许模式受到脑区间相关性的约束。然而,究竟需要哪些相关性、以及需要多少相关性才能预测大尺度神经活动,仍不明确。本文提出一个信息论框架,用于识别能够最准确预测神经状态的关键相关性。将该框架应用于人类大脑皮层活动数据,研究发现活动中的绝大部分方差可由少量相关性解释。这意味着大脑具有高度可压缩性:仅需稀疏的相关性网络即可预测大尺度活动。这种可压缩性在不同个体与认知任务中表现出惊人的一致性,并且与直觉相悖的是,最重要的相关性未必是最强的。综合而言,这些结果表明预测神经活动几乎不需要所有相关性,而本研究提供的工具能够揭示其中关键的相关性集合。
[3] 人类生命周期中高幅事件的变化
标题:Variation in high-amplitude events across the human lifespan
链接:https://direct.mit.edu/netn/article/10/1/158/133794/Variation-in-high-amplitude-events-across-the
作者:Youngheun Jo, Jacob Tanner, Caio Seguin, Joshua Faskowitz, Richard F. Betzel
单位:印第安纳大学
摘要:
边时间序列将功能连接分解为精细尺度、逐帧的贡献。先前研究已证明,边时间序列中的全局高幅值“事件”可聚类为不同模式。然而,这些事件及其模式在人类生命周期中是否变化或保持稳定尚未被探究。本研究基于内森克莱恩研究所-洛克兰样本,通过聚类事件帧直接探讨这一问题,该样本涵盖各年龄段的受试者。研究发现存在两个主要聚类,它们在不同受试者与年龄组间均出现,且其幅值与频率随年龄发生系统性变化。研究结果还表明,这些事件聚类与基于结构连接的通信测度存在异质性关联,且该关联随年龄改变。最后,事件聚类在预测人类智力与成就表型方面优于非事件数据。综合而言,本研究填补了当前关于边时间序列共波动模式与人类衰老的若干知识空白,为未来探究人类生命周期中功能连接变化的因果起源奠定了基础。
[4] 视觉中脑电图和脑磁图意识相关性的新证据与挑战:系统化综述
标题:New evidence and challenges in ERP and MEG correlates of consciousness in vision: A systematized review☆
链接:https://www.sciencedirect.com/science/article/pii/S1053811926000807
作者:Dmitri Filimonov, Mika Koivisto, Antti Revonsuo
单位:图尔库大学、斯克夫德大学
摘要:
过去二十年的研究表明,两个事件相关电位成分最可靠地作为视觉意识的神经关联:早期视觉觉知负波与晚期正成分。此前三项系统性综述均认为,早期视觉觉知负波是纯粹的视觉意识神经关联,仅受觉知水平调制。自最新综述发表以来的五年间,关于视觉意识的 ERP 关联积累了大量新证据。本系统综述通过分析 2020 年后发表的 53 项新研究并讨论其发现,对先前综述结论进行更新。新证据与早期结论一致:早期视觉觉知负波仍是视觉中最可靠且稳健的 ERP 神经关联,而晚期正成分还反映许多其他过程,并非仅对应意识本身。然而,早期视觉觉知负波的若干方面仍需进一步探究,例如其与注意力的关系及伴随的生理因素。
Mindverse Research
心识研究院
心识浩渺连广宇
心识宇宙研究院,致力于在即将到来的元宇宙数字时代,研究和创造真正等价于人类意识水平的数字生命,目前已经综合多种研究进路和方法规划出一条通向AGI和人工意识的道路。在后续内容运营上,我们也会介绍和创造更多有关人工智能、意识科学、元宇宙方面最新的研究成果和原创内容。
欢迎有志者关注和加入我们的研究!
热门跟贴