█ 脑科学动态
冷酷无情源于大脑皮层更薄
计算模型揭示大脑如何解决“鸡尾酒会难题”
大脑额叶-杏仁核神经通路可预测抗抑郁药疗效
迷幻剂如何促使大脑在清醒状态下做梦
全球专家共识确认厌食症是代谢与精神双重疾病
就医之路,贫富殊途:社会经济地位决定老年人看病半径
放疗是癌症患者生活质量下降的主要原因
█ AI行业动态
陈天桥AI团队另辟蹊径:MiroThinker模型精准预测15天后金价
告别康奈尔,学术预印本平台arXiv宣布独立运营并招募首任CEO
德国思想巨匠哈贝马斯逝世
█ AI驱动科学
Nature:4D成像传感器芯片助力机器人同时追踪距离与速度
MOOSE-Star打破组合复杂度壁垒,解锁大模型直接进行科学发现的训练范式
大脑记忆有望被定向读写,AI与脑机接口开启自然情境记忆解码新框架
RandOpt算法:大模型预训练权重周围存在神经丛林
清华大学等开发首个全模态大脑解码基础模型NOBEL
犬类认知启发机器人:结合语言与手势实现89%寻物成功率
DeepMind提出LoGeR:基于混合记忆实现长序列3D重建突破
脑科学动态
冷酷无情源于大脑皮层更薄
精神病态特征(如冷酷、缺乏同理心)是否根植于大脑的物理结构?西班牙Ángel Romero-Martínez团队通过对暴力犯罪者和普通人的脑部扫描研究发现,无论个体是否有暴力史,更高的精神病态特质均与额颞顶叶皮层的特定区域变薄显著相关,这为理解反社会行为的神经基础提供了新证据。
▷ 文献强调了图中所示脑区皮层厚度的变化与男性样本中的精神病态特征相关。Credit:Aggression and Violent Behavior (2026).
研究团队招募了125名男性,包括67名亲密伴侣暴力施暴者和58名对照者。他们使用精神病态量表修订版(PCL-R)评估了每位参与者的精神病态特质,并利用磁共振成像(MRI)技术测量其大脑皮层厚度。分析结果显示,精神病态特质得分越高,左侧眶额皮质(left orbitofrontal cortex,与决策和冲动控制相关)、左侧岛叶(left insula,与解读他人观点有关)、双侧额上回、右侧背内侧前额皮质以及右侧前扣带回皮质的厚度就越薄。这种负相关关系在暴力施暴者和对照组中普遍存在,表明大脑皮层变薄可能是精神病态的一个普遍神经标志,而不仅仅是暴力行为的后果。研究人员指出,由于脑扫描数据难以伪造,结合神经影像与传统心理评估,将有助于法医专家更准确地描绘精神病态个体的心理画像。研究发表在 Aggression and Violent Behavior 上。
#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #精神病态
阅读更多:
Romero-Martínez, Ángel, et al. “Reduced Cortical Thickness in Fronto-Temporo-Parietal Regions Associated with High Psychopathic Traits: Conclusions of a Review and an Empirical Study with Intimate Partner Violence Perpetrators.” Aggression and Violent Behavior, vol. 87, Mar. 2026, p. 102134. ScienceDirect, https://doi.org/10.1016/j.avb.2026.102134
计算模型揭示大脑如何解决“鸡尾酒会难题”
大脑如何在嘈杂环境中锁定单一声音(即“鸡尾酒会难题”)?麻省理工学院和哈佛大学的Josh McDermott, Ian Griffith和R. Preston Hess团队构建了一个听觉系统计算模型。该模型通过模拟神经元对目标声音特征(如音调)的活动增益,成功再现了人类的选择性听觉能力及其成功与失败的模式,并预测了新的听觉现象。
▷ 脑与认知科学教授、麦戈文研究所副研究员乔什·麦克德莫特(左)与研究生伊恩·格里菲斯坐在扬声器阵列室里,他们正是在这里进行了这项研究。Credit: Steph Stevens
研究团队构建了一个深度神经网络模型来模拟听觉系统。其核心机制在于引入了“乘法增益”(multiplicative gains),即当注意力集中于某个声音时,模型中对该声音特征(如特定音高或空间位置)敏感的神经处理单元活动会被放大,而对其他声音特征的响应则被抑制。在实验中,模型首先接收一段目标声音作为“线索”,然后在一个包含目标声音和干扰声音的混合音频中识别出目标声音说出的特定词语。结果显示,该模型不仅在多种条件下表现出与人类惊人相似的听觉选择能力,甚至会犯下与人类类似的错误,例如在区分两个音调相近的同性声音时更容易混淆。更重要的是,该模型成功预测了两个此前未被证实的人类听觉注意力新特性,并随后通过人类实验得到验证:首先,空间注意力的分离效果在水平方向上远强于垂直方向;其次,注意力的“聚光灯”在正前方时范围较窄,而在侧方时则更宽。此外,模型中注意力的增强效果主要发生在处理后期,这与人类大脑听觉皮层的神经活动观测结果一致,表明这种机制可能是大脑解决该问题的有效策略。研究发表在 Nature Human Behaviour 上。
#认知科学 #计算模型与人工智能模拟 #选择性注意 #鸡尾酒会问题
阅读更多:
Griffith, Ian M., et al. “Optimized Feature Gains Explain and Predict Successes and Failures of Human Selective Listening.” Nature Human Behaviour, Mar. 2026, pp. 1–23. www.nature.com, https://doi.org/10.1038/s41562-026-02414-7
大脑额叶-杏仁核神经通路可预测抗抑郁药疗效
如何为重度抑郁症(MDD)患者精准选择抗抑郁药,避免漫长的“试错”过程?由Li Xue、Ting Wang及同事(南京东南大学、南京医科大学等机构)领导的研究团队发现,大脑中连接额叶与杏仁核的特定神经通路强度,可以作为预测患者对两种主流药物——选择性血清素再摄取抑制剂(SSRIs)或血清素-去甲肾上腺素再摄取抑制剂(SNRIs)疗效的生物标志物。
▷ 皮质-杏仁核白质连接的组间比较。Credit: Molecular Psychiatry (2026).
研究团队利用扩散张量成像(DTI,一种无创的脑成像技术,用于观察水分子在脑白质中的运动)分析了106名重度抑郁症患者的大脑结构连接。他们发现,对SSRIs反应良好的患者与对SNRIs反应良好的患者,其额叶与内侧杏仁核之间的白质连接强度存在显著差异。这种结构上的差异形成了一种“药理学倾向模式”,意味着通过分析该通路的强度,或许能预测哪种药物对特定患者更有效。更深一步的分析揭示,这一宏观的大脑连接模式与微观的分子基础(即血清素和去甲肾上腺素递质系统)高度相关,并受到关键基因(如SLC6A4)遗传风险的影响。这一发现整合了宏观脑影像、微观分子结构和遗传信息,为实现抑郁症的精准治疗提供了新的路径。研究发表在 Molecular Psychiatry 上。
#疾病与健康 #神经机制与脑功能解析 #个性化医疗 #心理健康与精神疾病
阅读更多:
Xue, Li, et al. “A Nuclei-Specific Fronto-Amygdala Pathway and Its Neurotransmitter Receptor Distribution: Implications for Antidepressant Selection.” Molecular Psychiatry, Feb. 2026, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41380-026-03502-w
迷幻剂如何促使大脑在清醒状态下做梦
迷幻剂为何会让人产生幻觉,体验到“清醒的梦境”?Dirk Jancke, Thomas Knöpfel, Callum M. White等研究人员通过小鼠实验揭示了其背后的神经机制。研究发现,迷幻剂通过增强大脑视觉皮层与记忆区域的同步活动,使大脑的内部记忆凌驾于外部现实之上,从而“看见”并不存在的景象。
研究团队采用先进的电压成像技术,实时监测基因改造小鼠大脑皮层的神经活动。实验中,小鼠在观看视觉刺激前后被注射了一种强效的5-HT2A受体激动剂(5-HT2A agonist,一种模拟LSD等迷幻剂效果的化学物质)。结果显示,药物显著增强了大脑初级视觉皮层和后扣带皮层之间的慢速节律性振荡,即θ节律。这种增强的同步活动表明,迷幻剂像一个开关,它削弱了大脑对眼睛所见真实画面的处理,同时放大了来自记忆区域的内部信号。大脑不再依赖外部输入,而是开始用自身的记忆片段来“填补”视觉,创造出一个生动的、自我生成的世界,这为视觉幻觉的形成提供了有力的生物学解释。研究发表在 Communications Biology 上。
#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #迷幻剂 #幻觉
阅读更多:
White, Callum M., et al. “Psychedelic 5-HT2A Agonist Increases Spontaneous and Evoked 5-Hz Oscillations in Visual and Retrosplenial Cortex.” Communications Biology, vol. 9, no. 1, Jan. 2026, p. 216. www.nature.com, https://doi.org/10.1038/s42003-025-09492-9
全球专家共识确认厌食症是代谢与精神双重疾病
神经性厌食症的生物学基础是什么,又该如何客观评估?为解决此问题,世界生物精神病学会联盟(WFSBP)组织了一个由Hubertus Himmerich, Janet Treasure, Johanna L. Keeler等53名全球顶尖专家组成的工作组。他们通过系统性地整合多学科证据,首次发布了一份关于神经性厌食症候选生物标志物的综合性共识声明。
该声明汇集了遗传学、表观遗传学、免疫学及神经科学等领域的最新发现,为理解厌食症提供了全新的生物学框架。研究指出,遗传学证据明确支持厌食症不仅是精神疾病,也是一种代谢紊乱。表观遗传学研究则发现,该疾病与患者体内胆固醇和脂肪合成的失衡有关。此外,研究还强调了肠道微生物群紊乱、免疫系统功能异常(如产生错误攻击食欲调节激素的抗体)在厌食症发展中的关键作用。工作组提出的候选生物标志物清单覆盖范围广泛,从体重、心率等传统生理指标,到脑容量等神经影像学数据,再到通过智能手机追踪行为模式的数字生物标志物。这份里程碑式的共识旨在推动生物标志物在临床的应用,以实现对厌食症的早期、精准干预。研究发表在 The World Journal of Biological Psychiatry 上。
#疾病与健康 #心理健康与精神疾病 #神经性厌食症 #生物标志物 #国际共识
阅读更多:
Himmerich, Hubertus, et al. “World Federation of Societies of Biological Psychiatry (WFSBP) Consensus Statement on Candidate Biomarkers for Anorexia Nervosa.” The World Journal of Biological Psychiatry, Mar. 2026, pp. 1–92. DOI.org (Crossref), https://doi.org/10.1080/15622975.2026.2626934
就医之路,贫富殊途:社会经济地位决定老年人看病半径
美国老年人为看病愿意走多远,这一问题直接关系到医疗公平性。南加州大学多恩西夫经济与社会研究中心的Jeremy Burke和Soeren Mattke等人,通过一项全国性调查揭示,许多老年人愿意为就医付出超乎想象的时间,但这种意愿受到其健康状况和社会经济地位的显著影响。
研究团队对2650名65岁及以上的美国成年人进行了调查,分析了他们对不同类型医疗服务的可接受出行时间。结果显示,老年人就医意愿强烈,他们愿意为初级保健出行68分钟,为看专科医生出行128分钟(超过两小时),为进行核磁共振(MRI)等诊断性检查出行113分钟。然而,平均值背后隐藏着巨大的不平等。收入更高、受教育程度更好、能方便开车的群体愿意走得更远;相反,健康状况不佳、居住在交通拥堵的大城市或曾面临出行困难的老年人,即使是略微增加路程也可能成为放弃就医的障碍。这一发现对日益普遍的医疗系统整合和远程医疗发展具有重要启示,提醒政策制定者在规划医疗资源布局时,必须考虑距离之外的社会经济和交通因素,以确保弱势群体的医疗可及性。研究发表在 JAMA Network Open 上。
#疾病与健康 #疾病预防 #社会经济因素 #老龄化 #医疗可及性
阅读更多:
Burke, Jeremy, et al. “Willingness of Older Adults to Travel for Medical Care.” JAMA Network Open, vol. 9, no. 2, Feb. 2026, p. e2560280. Silverchair, https://doi.org/10.1001/jamanetworkopen.2025.60280
鼻咽癌(NPC)治疗在提高生存率的同时,也严重影响患者生活质量,如何平衡疗效与康复成为新挑战。中山大学肿瘤防治中心的马骏、徐骋等研究人员,通过一项名为PLATINUM的2期临床试验,系统分析了一种新型免疫联合治疗方案对患者生活质量的真实影响,研究揭示了放疗是导致生活质量下降的关键因素,并强调了将患者主观感受纳入疗效评估的重要性。
该研究基于一项2期临床试验,对152名接受纳武单抗(nivolumab)联合放化疗(但豁免了同步顺铂)的鼻咽癌患者进行了分析。研究核心是评估患者报告结局(Patient-reported Outcome,PRO),即患者对自己健康状况、功能及生活状态的主观感受,而非仅仅依赖传统的临床指标。结果显示,44.1%的患者成功实现了社会再融入。通过对比不同治疗阶段的影响,研究明确指出,放疗对生活质量的负面冲击远大于诱导化疗或纳武单抗,而停止放疗带来的改善也最为显著。数据还揭示,言语和吞咽功能障碍不仅与社会再融入失败密切相关,还预示着更高的局部复发风险。此外,一个重要的发现是,当临床医生低估患者报告的食欲下降严重程度时,患者的3年无失败生存率会显著降低。这项研究强调了社会再融入是评估患者康复的有效综合指标,并提示未来的治疗应更关注对特定功能的保护与干预。研究发表在 Med 上。
#疾病与健康 #健康管理与寿命延长 #鼻咽癌 #生活质量 #患者报告结局
阅读更多:
Xu, Cheng, et al. “Patient-Reported Outcomes from a Phase 2 PLATINUM Trial of Nivolumab Combination Therapy Sparing Concurrent Cisplatin in Nasopharyngeal Carcinoma.” Med, vol. 7, no. 3, Mar. 2026. www.cell.com, https://doi.org/10.1016/j.medj.2025.100994
AI 行业动态
陈天桥AI团队另辟蹊径:MiroThinker模型不求秒回,精准预测15天后金价
在众多AI公司竞相提升模型响应速度的当下,由陈天桥领衔的MiroMind团队反其道而行之,推出了专注于深度推理的新一代“重型”智能体MiroThinker-1.7系列。该系列包含235B参数的开源模型MiroThinker-1.7、30B的轻量版mini模型,以及刷新多项基准测试成绩的闭源模型MiroThinker-H1。不同于常规模型,MiroThinker旨在处理复杂的长链条智力任务,通过延长思考时间来换取结果的精确性与可验证性。其在BrowseComp(网页检索类大模型基准测试)和GAIA(通用AI助手基准测试)等权威测试中,以88.2%和88.5%的成绩超越了Gemini-3.1-Pro、GPT-5.4-Thinking等顶尖闭源模型,展现了强大的复杂任务处理能力。
MiroThinker的核心优势在实际应用中得到了印证。研究人员通过让模型在F1上海站比赛前2小时、赛中1小时等关键节点进行实时排名预测发现,它能动态抓取天气、车手状态、车队策略等实时信息,并逐步修正预测,最终与真实结果高度吻合。更令人印象深刻的是,该模型曾提前15天对黄金价格进行预估,预测值($5185/oz)与实际市场收盘价($5206.40)的误差仅为0.08%。这种精准度源于其核心技术——重型求解器(heavy-duty solver)与“可验证交互”理念。通过“中期训练”增强模型的规划与推理能力,并在每一步推理中引入局部与全局验证机制,确保最终答案基于严密的逻辑而非语义流畅度。这种“慢下来、想更多”的策略,让MiroThinker在金融、科研等需要深度求证的专业领域开辟了独特路径。
#MiroThinker #深度推理AI #陈天桥 #AI金融预测 #重型智能体
阅读更多:
https://github.com/MiroMindAI/MiroThinker
告别康奈尔,学术预印本平台arXiv宣布独立运营并招募首任CEO
服务全球科研界超过二十五年的预印本服务器arXiv,近日宣布了一个重大决定:它将结束与康奈尔大学的长期隶属关系,转型为一个独立运营的非营利组织。这一消息由平台官方正式发布,并同步启动了历史上首位首席执行官的全球招募工作,预期年薪约为30万美元。此举迅速在学术社区引发广泛讨论,观点从对新任CEO薪资水平的探讨,延伸到对平台未来走向的深层关切。然而,此次独立的核心驱动力在于,arXiv已从一个大学附属的研究项目,成长为托管近240万篇论文、月下载量超千万次的全球关键学术基础设施,其现有规模与复杂运营需求,已超出了大学附属项目的传统架构所能适配的范围。
事实上,arXiv的资金来源早已多元化。目前,康奈尔大学的直接支持仅占其运营费用的37%左右,其余资金来自西蒙斯基金会、美国国家科学基金会等机构的捐赠,以及全球约220家会员机构的年费。这意味着,arXiv实际上已是一个由全球学术共同体共同支撑的公共设施,但在行政、人事和财务决策上仍需遵循大学的流程,这种不匹配限制了其发展灵活性。独立后,平台将能更自主地推进技术迭代(如将系统迁移至谷歌云)、拓展合作并确保长期财务可持续。更重要的是,独立运营有助于强化其中立性,避免因依附单一机构可能引发的利益协调疑虑。然而,独立也带来了挑战,包括如何维系超过200名无偿服务的志愿审核员网络,以及如何在人工智能时代,面对科技巨头对高质量学术数据的巨大需求时,坚守其作为公益基础设施的定位,避免为短期利益而损害长期公信力。
#arXiv #预印本 #学术开放获取 #非营利转型 #学术基础设施
阅读更多:
https://tildes.net/~science/1t7g/arxiv_is_separating_from_cornell_university_and_is_hiring_a_ceo_who_will_be_paid_roughly_300_000
德国思想巨匠哈贝马斯逝世:以理性沟通守护民主的“最后欧洲人”
德国最具影响力的哲学家与公共知识分子于尔根·哈贝马斯(Jürgen Habermas)于3月14日在施塔恩贝格去世,享年96岁。在战后一片对理性深感幻灭的思想氛围中,哈贝马斯毕生逆流而上,为启蒙理想和真理的可能性进行了坚定的辩护。他在1960年代初提出的“公共领域”(public sphere)概念影响最为深远,该理论指出,一个独立于国家控制、公民能自由讨论和交换意见的空间,是民主健康存续的基石。这一概念此后在政治学、历史学乃至传媒研究等多个领域催生了海量研究。作为法兰克福学派第二代领军人物,他比前辈 Theodor Adorno 和 Max Horkheimer 对现代性抱有更多信心,视启蒙为一项“未竟的工程”,相信通过改善沟通可以纠正其弊端。在其1981年的主要著作《交往行为理论》(The Theory of Communicative Action)中,他系统阐述了通过平等对话达成共识的“理想言说情境”,认为这种将观念置于“无情公共话语的酸浴”中的过程,能让公民集体影响自身的社会命运。
哈贝马斯的学术生命始终与公共论辩紧密交织。他不仅以深邃甚至艰涩的哲学著作闻名,更通过大量报刊文章频繁介入现实,其核心关切始终是民主的存续与倒退的风险。出生于1929年的他,青少年时期亲历了纳粹统治,这段经历使他终生警惕民族主义,并坚持德国必须毫无扭曲地铭记大屠杀的罪责。1980年代,他因严厉抨击试图 relativize(相对化,即淡化某事件历史严重性)大屠杀的右翼历史学家,引发了著名的“历史学家之争”。他同样对欧洲一体化进程忧心忡忡,被视为守护欧洲理念的“最后欧洲人”。晚年,他也关注宗教在公共生活中的角色,倡导在“后世俗社会”中调和启蒙传统与宗教信仰。尽管被批评为过于理想主义,哈贝马斯从黑暗历史中走出却始终怀抱沟通理性的希望,正如研究者所言,他“是一个希望的形象”,深信民主依赖于“人们相信仍有集体塑造未来的空间”。
#哈贝马斯 #公共领域 #交往行为理论 #法兰克福学派 #启蒙理性
阅读更多:
https://www.nytimes.com/2026/03/14/books/jurgen-habermas-dead.html
AI 驱动科学
Nature:4D成像传感器芯片助力机器人同时追踪距离与速度
传统机器视觉系统难以即时测量快速运动物体的速度,且往往体积庞大、成本高昂。Francesca Fabiana Settembrini和Remus Nicolaescu等开发出一种大规模相干4D成像传感器芯片,能够在创建环境三维地图的同时追踪运动物体速度,实现了低成本且紧凑的机器视觉突破。
▷ 示例点云。Credit: Nature (2026).
研究人员在单块硅芯片上构建了包含61952个固定像素的焦平面阵列(focal plane array,一种将微型光电传感器密集排列在光学系统焦平面上的物理网格)。与传统脉冲激光不同,该芯片采用调频连续波激光雷达(FMCW LiDAR,一种发射连续频率调制激光并检测反射光波频率微小变化以同时计算距离和速度的技术)。芯片内部的集成热光开关网络将外部连续激光依次引导至不同像素组,每个像素既是发射器也是接收器,大幅缩小了系统体积。测试数据显示,该芯片能以每秒3到15帧的帧率生成包含数千个数据点的三维点云。在室内,系统成功绘制了6至11米范围的地图;在室外,芯片准确捕捉到了65米外建筑物的阳台细节,角分辨率达0.06度,且单点能耗仅为46纳焦耳。在针对旋转圆盘的测试中,该传感器瞬间完成了速度的精确测量。这项集成了超60万个光子元件和相关电子器件的技术,不仅将像素数量提升五倍,更极大降低了生产成本。研究发表在 Nature 上。
#疾病与健康 #跨学科整合 #再生医学 #嵌合体 #先天免疫
阅读更多:
Settembrini, Francesca Fabiana, et al. “A Large-Scale Coherent 4D Imaging Sensor.” Nature, vol. 651, no. 8105, Mar. 2026, pp. 364–70. www.nature.com, https://doi.org/10.1038/s41586-026-10183-6
MOOSE-Star打破组合复杂度壁垒,解锁大模型直接进行科学发现的训练范式
如何让大语言模型直接生成科学发现一直面临巨大的计算组合复杂度壁垒?Zonglin Yang与Lidong Bing(MiroMind AI)提出了一套通用的科学发现理论框架,成功打破了这一死锁,并首次在该领域清晰观察到了训练期与推理期的Scaling Law。
过去直接训练大模型进行科学发现往往会陷入从海量文献库中检索和组合灵感的计算爆炸(combinatorial explosion),搜索空间的复杂度高达O(N^k)。为打破这一壁垒,研究团队提出了MOOSE-Star框架。该方法摒弃了端到端训练,采用灵感检索与假设组合的分离训练范式,将指数级复杂度降至线性。同时,团队引入动机引导的分层搜索,模型先生成明确的研究动机,再沿着结构化的全局知识树进行定向检索,理想情况下将检索复杂度进一步降维至对数级别。为提升鲁棒性,模型采用了容错组合机制,在存在一定检索噪声的上下文中通过严密的生成式推理推导科学假设。为支撑该框架的训练,团队耗费38400个GPU小时解构了108717篇真实论文的推导链路,构建出TOMATO-Star数据套件。实验证实,随着训练数据规模的扩张和推理期投入算力的增加,模型产出高质量科学假设的成功率呈现稳定且持续的增长,彻底打破了传统暴力采样面临的复杂性高墙。
#AI驱动科学 #大模型技术 #自动化科研 #科学发现
阅读更多:
Yang, Zonglin, and Lidong Bing. “MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier.” arXiv:2603.03756, arXiv, 4 Mar. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2603.03756
大脑记忆有望被定向读写,AI与脑机接口开启自然情境记忆解码新框架
真实生活中的复杂情节记忆是如何被大脑编码以及能否被定向干预一直是个未解之谜。南加州大学的Dong Song团队提出了一套整合框架,产生了一套能在自然情境下验证并调控记忆代码的系统工程。
研究人员提出了一种多模态建模框架,首先分别训练神经侧和行为侧的编码器。一边输入大规模神经记录如局部场电位,另一边输入自然场景中的视觉流和语义等行为信息,随后将二者投射到同一个潜在空间中进行对齐。这使得模型能从自然数据中发现记忆结构。在此基础上,研究构建了一个闭环记忆脑机接口系统,在解码与记忆成功相关的神经模式后,通过电刺激等反馈手段在毫秒级尺度上实时干预神经回路。此外,团队提议借助大语言模型分析受试者的自由叙述,从而评估记忆的主观体验感。这一框架为未来开发记忆假体以治疗阿尔茨海默病和创伤后应激障碍等疾病提供了理论支撑。研究发表在 Advanced Science 上。
#意识与脑机接口 #脑机接口 #人工智能 #记忆机制 #神经调控
阅读更多:
Song, Dong. Decoding Naturalistic Episodic Memory with Artificial Intelligence and Brain‐Machine Interface. advanced.onlinelibrary.wiley.com, https://doi.org/10.1002/advs.202520125. Accessed 16 Mar. 2026
RandOpt算法:大模型预训练权重周围存在神经丛林
大模型后训练必须依赖复杂的强化学习吗?Yulu Gan和Phillip Isola(麻省理工学院计算机科学与人工智能实验室)发现预训练模型权重空间内潜藏大量任务专家,证实随机扰动与集成算法即可超越传统方法。
研究团队提出了一种名为RandOpt的后训练算法。该算法完全抛弃了梯度计算,而是直接向预训练模型的权重中添加单步的高斯噪声,生成大量随机扰动后的模型副本。随后在验证集上选出表现最好的若干模型,并在测试时通过多数投票机制得出最终答案。实验结果表明,在数学推理和代码生成等复杂任务中,RandOpt在相同的浮点运算次数下,不仅追平甚至超越了近端策略优化等传统基准方法。研究揭示了随着模型规模的扩大,参数空间会从稀疏状态转变为密集的神经丛林。这意味着大规模预训练模型本身已天然自带任务专家,后训练的本质更倾向于挑选已有能力而非从零学习。此外,研究还证实简单的蒸馏策略可将该方法的计算成本降至百分之二。
#大模型技术 #其他 #后训练 #强化学习 #参数空间
阅读更多:
Gan, Yulu, and Phillip Isola. “Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights.” arXiv:2603.12228, arXiv, 12 Mar. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2603.12228
清华大学等开发首个全模态大脑解码基础模型NOBEL
如何打破非侵入式脑信号由于特征差异巨大而无法统一解析的壁垒?Changli Tang与Shurui Li等(清华大学及上海人工智能实验室等机构)开发了首个全模态大脑解码大语言模型NOBEL,成功在共享语义空间内实现了异构脑信号的统一解码,为全面理解大脑动态奠定了基础。
研究团队构建了一个大语言模型框架。针对高频电磁信号,模型采用统一的脑电图与脑磁图编码器。对于低频代谢信号,研究设计了双路径策略来提取功能磁共振成像的动态响应与静态特征。这些异构脑信号连同外部视觉或听觉刺激被共同映射到共享语义空间中,使系统能根据自然语言提示生成解析结果。实验显示,NOBEL在多种单模态分类基准测试中优于现有专门模型。值得注意的是,融合电磁与代谢信号能获得比单一模态更高的解码准确率。此外,该模型在刺激感知解码任务中表现优异,不仅能有效解析大脑响应中的视觉语义,还验证了感觉输入与神经活动间的因果关系。
#意识与脑机接口 #大脑信号解析 #大模型技术 #多模态融合
阅读更多:
Tang, Changli, et al. “One Brain, Omni Modalities: Towards Unified Non-Invasive Brain Decoding with Large Language Models.” arXiv:2602.21522, arXiv, 25 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2602.21522
犬类认知启发机器人:结合语言与手势实现89%寻物成功率
当机器人在杂乱环境中为人类寻找物品时常因指令模糊或视线遮挡而失败(寻找物品与理解模糊指令的问题)。Ivy Xiao He、Stefanie Tellex与Jason Xinyu Liu等(布朗大学)开发了一种融合人类语言和手势的新型框架,使机器人在复杂环境中的寻物成功率达到了百分之八十九(产生了高准确率的多模态寻物系统)。
现实世界充满了不确定性,单一的视觉或语言指令往往不足以让机器人准确找到目标。为了解决这一难题,研究团队开发了一种名为语言和手势引导的部分可观测环境物体搜索(LEGS-POMDP,一种使机器人在不确定性下进行推理并结合多模态输入的数学决策框架)的模块化系统。该系统的一大创新在于借鉴了狗如何理解人类意图的认知科学成果。研究人员分析了人类的指向动作,建立了一个基于眼睛到手肘再到手腕连线的概率锥模型(cone of probability,将指向目标划定在特定锥形空间范围内的数学模型)。随后研究人员将该手势模型与视觉语言模型相结合,把不同的输入转化为概率分布,帮助机器人不断更新对周围环境的认知置信度。在实验室的模拟环境和四足移动机械臂的真实测试中,该系统展现了极高的鲁棒性。实验数据显示,当机器人结合手势和语言指令时,能够在各种复杂场景下正确定位散落的物体,平均成功率达到百分之八十九左右,远超仅依赖单一感知模式的基准测试结果。这项研究不仅为处理人类交流中固有的模糊性提供了解决方案,也展示了计算机科学与认知科学结合的巨大潜力。研究发表在 Proceedings of the 21st ACM/IEEE International Conference on Human-Robot Interaction 上。
#认知科学 #机器人及其进展 #多模态融合 #人机交互 #POMDP
阅读更多:
He, Ivy Xiao, et al. “LEGS-POMDP: Language and Gesture-Guided Object Search in Partially Observable Environments.” Proceedings of the 21st ACM/IEEE International Conference on Human-Robot Interaction, 2026, pp. 227–36. arXiv.org, https://doi.org/10.1145/3757279.3785585
DeepMind提出LoGeR:基于混合记忆实现长序列3D重建突破
前馈3D重建处理长序列视频时常受限于上下文窗口。Junyi Zhang等(谷歌DeepMind和加州大学伯克利分校)提出LoGeR架构,利用混合记忆模块将密集3D重建扩展至近两万帧,显著降低了轨迹误差与尺度漂移。
该研究将视频流分块处理,并设计了一个双组件的混合记忆模块来确保跨块的几何一致性。该模块结合了参数化的测试时训练进行长时信息的有损压缩,以此锚定全局坐标系并防止尺度漂移;同时,采用非参数化的滑动窗口注意力实现短时上下文的无损传递,保证相邻分块的高精度对齐。此外,研究使用渐进式课程策略逐步引导模型适应长距依赖。实验表明,LoGeR在128帧序列上训练后,推理时可泛化至数千乃至近两万帧的超长视频。在KITTI数据集上,该方法将绝对轨迹误差降低了74%以上,超越了基于优化的最强基线。在长达19000帧的VBR数据集评测中,该模型也成功克服了传统方法的局限,保持了极高稳定性的全局尺度。
#大模型技术 #计算模型与人工智能模拟 #记忆机制 #3D重建 #空间计算
阅读更多:
Zhang, Junyi, et al. “LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory.” arXiv:2603.03269, arXiv, 3 Mar. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2603.03269
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。
研究院还建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、、科普视频媒体「大圆镜」等。
热门跟贴