追问daily | 多睡15分钟，就能让青少年更聪明；面对虚拟人，人类更敢赌；多运动，思维更敏锐|多巴胺|神经元|脑功能|脑科学|虚拟人|虚拟现实|青少年

█脑科学动态

Nature：基因突变分型为精神疾病精准治疗提供新路径

不用开颅也能做"脑扰动实验"？用AI孪生脑刻画脑网络因果

多睡15分钟，就能让青少年更聪明

产前压力导致女童情绪与免疫系统易感性增加

面对虚拟人更敢赌，研究揭秘杏仁核的"胆量调控术"

宝宝爱哭闹？父母日常互动可降低焦虑风险

多巴胺双面舞：大脑如何学会规避风险

多运动，思维更敏锐：体育活动促进老年人的大脑健康

大脑"蝴蝶效应"揭秘：局部小改动如何引发全脑大变动

大脑左右半球：独立运作与协同交互的神经机制

█AI行业动态

ICLR 2025杰出论文揭晓

微软突破性AI模型：CPU也能跑，能耗直降90%！

AI智能体能力爆发：完成任务时长每7个月翻倍

谷歌推出"思考预算"可控AI模型，推理能力按需付费

Google Research推出“Mobility AI”计划

█AI驱动科学

机器人看视频学技能：单次观看实现跨形态模仿

大脑视觉启发AI革新：Lp-Convolution突破机器视觉瓶颈

告别"AI失忆症"！SD-LoRA算法实现终身学习突破

AI实现3D游戏零样本迁移，跨游戏直接上手操作

脑科学动态

Nature：基因突变分型为精神疾病精准治疗提供新路径

精神疾病治疗面临同一基因不同突变导致差异症状的难题。耶鲁大学的Kristen Brennand与西奈山伊坎医学院的Gang Fang、Paul Slesinger团队发现，神经突触关键基因neurexin-1存在"功能丧失"和"功能获得"两种突变机制，需采用完全不同的干预策略。

研究团队将4名携带neurexin-1突变患者的皮肤细胞重编程为诱导多能干细胞（iPSCs），再分化为两类关键神经元：负责兴奋信号的谷氨酸能神经元（iGLUT）和负责抑制信号的GABA能神经元（iGABA）。电生理记录显示，两类突变殊途同归——功能丧失突变（LOF）导致neurexin-1蛋白产量减半，而功能获得突变（GOF）产生异常蛋白，但均使谷氨酸神经元活动降低40%，GABA神经元活动反增35%。研究人员用雌二醇成功挽救LOF突变神经元功能，而GOF突变需特定DNA片段阻断错误蛋白合成。该发现颠覆了"同基因同治疗"的传统思路。研究发表在 Nature 上。

#疾病与健康 #个性化医疗 #心理健康与精神疾病 #神经调控 #精准医疗

阅读更多：

Fernando, Michael B., et al. “Phenotypic Complexities of Rare Heterozygous Neurexin-1 Deletions.” Nature, Apr. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-025-08864-9

不用开颅也能做"脑扰动实验"？用AI孪生脑刻画脑网络因果

如何非侵入式绘制全脑因果图谱？南方科技大学刘泉影团队联合香港科技大学胡禹、香港浸会大学周昌松等研究者，通过构建AI数字孪生脑并施加虚拟扰动，首次发布人脑有效连接图谱（EBC），揭示了脑区间因果交互的方向性与调控特性。

研究提出神经扰动推断（NPI）框架，先训练人工神经网络（ANN）作为孪生脑建模脑活动动态，再通过系统扰动各脑区节点并记录响应，量化有效连接（EC）的方向、强度及兴奋/抑制属性。在模拟数据中，NPI推断的EC与真实连接相关性显著优于格兰杰因果分析（Granger causality）。应用于800人的静息态功能磁共振成像（rs-fMRI）数据后，发现兴奋性连接多位于功能网络内部（如默认模式网络），而抑制性连接常见于跨网络区域。更关键的是，NPI结果与癫痫患者的皮层-皮层诱发电位（CCEP）数据高度匹配，证实其临床价值。研究发表在 Nature Methods 上。

#AI驱动科学 #神经调控 #神经机制与脑功能解析 #计算模型与人工智能模拟 #跨学科整合

阅读更多：

Luo, Zixiang, et al. “Mapping Effective Connectivity by Virtually Perturbing a Surrogate Brain.” Nature Methods, Apr. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41592-025-02654-x

多睡15分钟，就能让青少年更聪明

剑桥大学的Barbara J. Sahakian和复旦大学的Wei Cheng团队通过大规模研究发现，早睡且睡眠时间较长的青少年表现出更好的脑功能和认知能力，即使睡眠时间差异仅15分钟也能观察到显著差异。

研究团队利用青少年大脑认知发展研究中3,222名11-12岁参与者的Fitbit客观睡眠数据，结合脑部扫描和认知测试结果。通过稀疏典型相关分析识别出两个关键睡眠-脑维度：一个将晚睡和短睡眠与皮层下-皮层连接减少相关联，另一个将高心率和短浅睡眠与脑容量降低相关联。分层聚类分析揭示了三种青少年生物型：生物型1（39%）表现为晚睡、短睡眠和高心率；生物型3（37%）则相反，表现为早睡、长睡眠和低心率；生物型2（24%）处于中间状态。认知测试显示，生物型3在词汇、阅读和问题解决等任务中表现最佳，生物型1表现最差。纵向分析证实这些差异从9岁持续到14岁。研究发表在 Cell Reports 上。

#疾病与健康 #神经机制与脑功能解析 #青少年发展 #睡眠科学 #认知表现

阅读更多：

Ma, Qing, et al. “Neural Correlates of Device-Based Sleep Characteristics in Adolescents.” Cell Reports, vol. 44, no. 5, May 2025. www.cell.com, https://doi.org/10.1016/j.celrep.2025.115565

产前压力导致女童情绪与免疫系统易感性增加

孕期压力如何影响胎儿发育？耶路撒冷希伯来大学的Hermona Soreq和Shani Vaknine Treidel团队联合慕尼黑工业大学等机构发现，母亲压力会重塑新生儿分子通路，尤其导致女婴胆碱能系统和免疫相关tRNA片段发生显著改变，这些变化可能增加未来情绪障碍风险。

▷tRF 家族在应激组和对照组之间存在显著差异，并且在母亲和新生儿之间存在一些相反的影响。 Credit: Molecular Psychiatry (2025).

研究团队采集了120对母婴的脐带血，重点分析了一种调控基因表达的小RNA分子——tRNA片段（tRFs）。通过高通量测序和机器学习分析发现，承受压力的母亲所生女婴出现特定线粒体tRFs家族近乎完全消失的现象，这些被称为"CholinotRFs"的分子能靶向调控乙酰胆碱相关基因。研究同时发现男婴乙酰胆碱酯酶（AChE）活性异常升高，表明其压力反应系统从出生即失衡。利用这些生物标志物构建的分类模型对女婴压力暴露的判断准确率高达95%。这些发现揭示了产前压力通过胆碱能系统（控制情绪和免疫的重要通路）对后代产生性别特异性影响的分子机制，为早期干预提供了潜在靶点。研究发表在 Molecular Psychiatry 上。

#疾病与健康 #个性化医疗 #心理健康与精神疾病 #神经调控 #产前压力

阅读更多：

Vaknine Treidel, Shani, et al. “Maternal Prenatal Stress Induces Sex-Dependent Changes in tRNA Fragment Families and Cholinergic Pathways in Newborns.” Molecular Psychiatry, Apr. 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41380-025-03011-2

面对虚拟人更敢赌，杏仁核的胆量调控术

日本国家信息与通信技术研究所的Toshiko Tanaka和Masahiko Haruno团队发现，当沟通伙伴以虚拟形象（avatar）而非真人面孔出现时，人们赌博意愿显著增加，而大脑杏仁核（amygdala）对反馈不确定性的异常响应是关键机制。

▷Credit: Toshiko Tanaka

研究设计精巧的赌博实验：28名参与者需在"安全选项"和"赌博选项"间抉择，同时接收来自真人或虚拟形象观察者的动态表情反馈。功能磁共振成像（fMRI，51人数据）显示，虚拟形象条件下赌博率提升23%，计算模型揭示这与大脑对表情反馈不确定性的"估值溢价"相关。杏仁核表现出独特活动模式——其对不确定性的负向响应越强，个体越倾向冒险。有趣的是，这种效应在共情能力（通过人际反应指数量表测量）较低的个体中更显著，暗示虚拟形象可能削弱了社交顾虑。研究为虚拟社交的风险决策机制提供了首个神经证据，对网络赌博防治和虚拟现实设计具有启示意义。研究发表在 PLOS Biology 上。

#认知科学 #神经机制与脑功能解析 #风险决策 #虚拟现实 #杏仁核

阅读更多：

Tanaka, Toshiko, and Masahiko Haruno. “Feedback from an Avatar Facilitates Risk-Taking by Modulating the Amygdala Response to Feedback Uncertainty.” PLOS Biology, vol. 23, no. 4, Apr. 2025, p. e3003122. PLoS Journals, https://doi.org/10.1371/journal.pbio.3003122

宝宝爱哭闹？父母日常互动可降低焦虑风险

约20%的婴儿天生具有易躁动、高敏感的气质，这可能导致未来的情绪问题。赖希曼大学的Tahli Frenkel团队与加州大学戴维斯分校合作发现，父母若能在第一年采用"条件性响应"（contingent responsiveness，即精准回应婴儿信号）的养育方式，可重塑婴儿大脑活动模式，降低情绪障碍风险。

研究追踪51对母婴，在婴儿4个月时通过视频记录评估母亲响应性（如对婴儿注视的及时回应）和婴儿气质（如对新刺激的哭闹反应）。11个月时，通过脑电图（EEG）测量发现，高敏感婴儿若经历高响应性养育，其风险性脑电模式（右额叶过度激活）会减弱。这些婴儿在陌生情境中表现更冷静，甚至展现出早期共情能力（如对他人疼痛的关注）。而未获响应性养育的高敏感婴儿，则出现典型的情绪调节困难脑电特征。研究证实，父母如同"神经雕塑家"，通过日常互动精细调整婴儿大脑发育轨迹。研究发表在 Developmental Psychology 上。

#疾病与健康 #心理健康与精神疾病 #神经机制与脑功能解析 #早期干预 #亲子互动

阅读更多：

Frenkel, Tahl I., et al. “Maternal Contingent Responsiveness Moderates Temperamental Risk to Support Adaptive Infant Brain and Socioemotional Development across the First Year of Life.” Developmental Psychology, vol. 60, no. 11, 2024, pp. 2157–77. APA PsycNet, https://doi.org/10.1037/dev0001764

多巴胺双面舞：大脑如何学会规避风险

多巴胺如何帮助大脑从负面经历中学习？西北大学范伯格医学院的Gabriela C. Lopez和Talia N. Lerner团队发现，伏隔核两个亚区的多巴胺信号以完全相反的方式协同工作，形成动态的"预警系统"。

研究人员训练小鼠在听到5秒警告提示（cue）后移动到安全区域以避免足部电击（footshock），同时通过光纤光度技术（fiber photometry，一种实时监测神经活动的光学方法）记录伏隔核核心区（Core）与腹内侧壳（vmShell）的多巴胺动态。结果显示：腹内侧壳区多巴胺早期对电击产生强烈反应（峰值达基础值180%），随着学习进展，反应转移至警告提示本身，最终在熟练期消失；而核心区多巴胺则呈现持续抑制（最低降至基础值60%），且对警告提示的抑制强度随训练增加3倍。当实验改为不可规避电击时，多巴胺模式迅速回归初始状态，证明其具有环境敏感性。这些发现揭示了多巴胺不仅是"快乐分子"，更是灵活的危险评估系统，其功能紊乱可能导致焦虑症等疾病的过度回避行为。研究发表在 Current Biology 上。

#神经科学 #神经机制与脑功能解析 #心理健康与精神疾病 #多巴胺 #规避学习

阅读更多：

Lopez, Gabriela C., et al. “Region-Specific Nucleus Accumbens Dopamine Signals Encode Distinct Aspects of Avoidance Learning.” Current Biology, vol. 0, no. 0, Apr. 2025. www.cell.com, https://doi.org/10.1016/j.cub.2025.04.006

多运动，思维更敏锐：体育活动促进老年人的大脑健康

如何通过日常活动优化老年认知？南澳大利亚大学的Audrey M Collins和Maddison L Mellow团队发现，每天仅需5分钟中高强度运动（MVPA）就能显著提升处理速度和工作记忆，且效果不受遗传背景影响。

研究团队使用腕戴式三轴加速度计（triaxial accelerometers，精确记录身体活动的穿戴设备）追踪585名65-80岁老年人24小时活动模式，发现中高强度运动（MVPA，如快走/游泳等显著提升心率的运动）与认知功能存在双向关联：增加MVPA时间可提升处理速度22%、工作记忆18%和执行功能（多任务处理能力）25%；反之减少运动则认知下降。特别值得注意的是，从完全不运动到每天仅运动5分钟的群体认知改善最显著。研究采用组合等时替代分析证实，用MVPA替代其他任何活动时间均能带来认知收益。这种效应独立于APOE4基因等风险因素。研究发表在 Age and Ageing 上。

#疾病与健康 #健康管理与寿命延长 #认知科学 #运动干预 #老年医学

阅读更多：

Collins, Audrey M., et al. “24-Hour Time Use and Cognitive Performance in Late Adulthood: Results from the Investigating Gains in Neurocognition in an Intervention Trial of Exercise (IGNITE) Study.” Age and Ageing, vol. 54, no. 4, Apr. 2025, p. afaf072. Silverchair, https://doi.org/10.1093/ageing/afaf072

大脑"蝴蝶效应"揭秘：局部小改动如何引发全脑大变动

大脑局部干预如何引发全脑功能重构？这一机制长期困扰神经科学家。由Giovanni Rabuffo、Houefa-Armelle Lokossou、Zengmin Li等15人组成的国际团队通过小鼠实验发现，丘脑损伤或皮层沉默会引发独特的全脑连接模式改变，这些改变既包含连接减弱也包含增强现象。

研究团队首先采集小鼠在接受丘脑损伤和皮层枢纽化学遗传沉默（chemogenetic silencing，利用工程受体选择性调控神经元活动）前后的功能磁共振成像（fMRI）数据。纵向分析显示，这些局部干预会破坏大脑维持全网络活动的能力。随后，他们构建了个性化小鼠全脑计算模型，模拟发现局部兴奋性改变会调制远端脑区的放电率和频率内容，从而驱动功能连接（FC）重构。特别值得注意的是，不同干预位点会产生独特的受影响脑区分布模式，这解释了为何文献中既有低连接也有高连接的报道。该框架为理解局部神经调控的系统性效应提供了机制性见解，有望优化脑部疾病的临床诊断和个性化神经调控策略。研究发表在 PNAS 上。

#神经科学 #神经调控 #神经机制与脑功能解析 #计算模型与人工智能模拟

阅读更多：

Rabuffo, Giovanni, et al. “Mapping Global Brain Reconfigurations Following Local Targeted Manipulations.” Proceedings of the National Academy of Sciences, vol. 122, no. 16, Apr. 2025, p. e2405706122. pnas.org (Atypon), https://doi.org/10.1073/pnas.2405706122

大脑左右半球：独立运作与协同交互的神经机制

大脑左右半球如何平衡独立与协作？麻省理工学院的Scott L. Brincat和Earl K. Miller团队通过综述人类与非人灵长类研究，揭示视觉信息在半球间传递时，高级皮层仍保留空间偏侧化特征。

研究整合近年神经生理学证据，发现尽管初级视觉皮层（V1）存在明显的视野分工，但高级认知区域仍表现出对侧空间处理偏好。通过分析视觉皮层层级，团队证实左右半球使用独立的注意机制，但当物体跨越视野中线时，半球间通过动态交互实现无缝衔接。例如，当猴子追踪移动物体时，前额叶皮层神经元会提前激活对侧半球对应区域，形成"预测性交接"。这种机制可能解释阿尔茨海默病患者常见的视觉空间障碍——其半球间信息传递效率下降50%。研究还发现，精神分裂症患者的胼胝体异常与幻觉症状严重度正相关（r=0.62）。研究发表在 Neuropsychologia 上。

#神经科学 #神经机制与脑功能解析 #认知科学 #跨学科整合 #视觉处理

阅读更多：

“Cognitive Independence and Interactions between Cerebral Hemispheres.” Neuropsychologia, vol. 212, June 2025, p. 109153. www.sciencedirect.com, https://doi.org/10.1016/j.neuropsychologia.2025.109153

AI 行业动态

ICLR 2025杰出论文揭晓：中国科大与Meta领衔AI安全与模型编辑突破

国际机器学习顶会ICLR 2025近日公布了三篇杰出论文奖和三项荣誉提名研究成果。中国科学技术大学与新加坡国立大学合作的《AlphaEdit》提出了一种创新的语言模型编辑技术，通过零空间约束避免知识篡改，仅需一行代码即可提升36.7%的编辑性能。Meta的分割一切2（SAM 2）凭借开源视频分割模型和六倍速图像处理能力入选荣誉提名，而普林斯顿大学团队则揭示了大型语言模型安全对齐的脆弱性，呼吁更深入的对齐机制。

获奖论文聚焦AI领域核心挑战。普林斯顿大学和Google DeepMind的研究人员发现，当前大语言模型的安全对齐仅作用于前几个token，导致易受越狱攻击，提出延伸对齐范围的方法。不列颠哥伦比亚大学团队则通过分析微调动态，解释了模型幻觉加剧的原因，并提出优化对齐效果的新框架。此外，数据Shapley值的计算效率突破和推测解码技术的改进也展现了研究的前沿性。

#ICLR2025 #AI安全 #模型编辑 #语言模型 #Meta

阅读更多：

https://blog.iclr.cc/2025/04/22/announcing-the-outstanding-paper-awards-at-iclr-2025/

微软突破性AI模型问世：CPU也能跑，能耗直降90%！

微软研究院与中国科学院大学的研究人员联合开发了一款名为BitNet b1.58 2B4T的新型AI模型，其最大特点是无需依赖高性能GPU，仅需普通CPU即可高效运行。该团队在arXiv预印本平台发布的论文中指出，传统大语言模型（LLMs）如ChatGPT依赖GPU进行训练和推理，主要因其处理海量数据时需极高算力，但这也导致能源消耗剧增。而新模型通过创新性的“1位架构”，将权重存储简化为-1、0、1三个值，仅需基础加减运算，大幅降低了内存和计算需求。

测试结果显示，BitNet b1.58 2B4T在同类模型中性能媲美甚至超越部分GPU驱动方案，同时能耗降低超90%。为适配这一架构，团队开发了专用运行时环境bitnet.cpp，进一步优化了CPU的运算效率。这一突破意味着未来用户或可在个人电脑或手机上本地运行高性能AI，无需依赖云端数据中心。

#微软AI #CPU运行 #节能技术 #1位架构 #本地化处理

阅读更多：

https://dx.doi.org/10.48550/arxiv.2504.12285

AI智能体能力爆发：完成任务时长每7个月翻倍

METR的研究人员通过分析2019年至2025年间最先进的AI智能体在约200项任务（以编程为主，兼有通用推理）中的表现，发现了一项关键趋势：AI成功完成任务的时间范围正呈指数级增长。研究显示，任务时长与AI成功率高度相关（R²=0.83），且AI能胜任的50%成功率任务时长每7个月翻倍。例如，2022年ChatGPT仅能处理30秒的编程任务，而如今已可完成人类需1小时的任务。按此趋势推算，2026年AI将处理2小时任务，2029年甚至可能攻克1个月时长的任务。

值得注意的是，2024至2025年间，这一趋势加速至每4个月翻倍。若持续加速，AI或于2027年实现处理月级任务。研究人员指出，随着AI自我改进能力的增强，其发展可能进入“超指数增长”阶段——更强大的AI将加速创造更先进的AI，形成技术迭代的飞轮效应。这种正反馈循环或使AI能力迅速超越人类研究者，甚至颠覆所有领域的发展模式。

#AI智能体 #指数增长 #自动化编程 #技术奇点 #METR研究

阅读更多：

https://theaidigest.org/time-horizons

谷歌推出"思考预算"可控AI模型，推理能力按需付费

谷歌近日发布全球首款混合推理模型Gemini 2.5 Flash，通过创新的"思考预算"机制实现推理能力精准调控。该模型在Gemini 2.0 Flash基础上进行重大升级，允许开发者通过0-24,576个token的动态区间设定计算资源分配，在保证速度的同时显著提升复杂问题处理能力。其定价策略直观体现推理价值：关闭思考功能时输出成本为每百万token 0.60美元，启用后飙升至3.50美元，近六倍差价折射出深度思考的计算强度。

在性能表现方面，Gemini 2.5 Flash展现出惊人竞争力。在评估推理能力的"人类最后一次考试"中，它以12.1%的得分超越Anthropic的Claude 3.7 Sonnet（8.9%）和DeepSeek R1（8.6%），仅略逊于OpenAI的o4-mini（14.3%）。Google DeepMind首席技术官Koray Kavukcuoglu强调，深度思考能提升模型解决编码、数学等专业问题的准确性，但团队也发现过度思考会导致成本激增和答案质量下降，为此特别开发了可调节的"推理滑块"。

Hugging Face工程师Nathan Habib指出，AI公司正从单纯扩大模型规模转向"延长思考时间"的新赛道，但需警惕"拿着锤子找钉子"的滥用风险。虽然DeepSeek等开放权重模型带来竞争压力，谷歌仍坚信专有模型在精度要求极高的金融、科研领域具有不可替代性。随着推理模型逐渐成为行业标配，这场关于计算资源、环境成本与智能上限的平衡术将持续考验开发者的智慧。

#Gemini2.5Flash #混合推理模型 #思考预算 #AI成本控制 #谷歌DeepMind

阅读更多：

https://www.technologyreview.com/2025/04/17/1115375/a-google-gemini-model-now-has-a-dial-to-adjust-how-much-it-reasons/

Google Research推出“Mobility AI”计划

Google Research推出“Mobility AI”计划，旨在通过人工智能技术提升城市交通系统的效率和可持续性。该计划聚焦于三个核心领域：测量、模拟和优化，旨在深入理解并复制交通网络和出行模式，从而更有效地设计和评估交通干预措施。通过整合高分辨率交通数据、先进的模拟技术和优化算法，Mobility AI致力于为城市交通管理提供科学、可行的解决方案，推动城市交通向更智能、绿色的方向发展。

Mobility AI计划首先通过高分辨率的交通数据收集和分析，建立了详细的交通网络模型。这些数据包括车辆行驶路径、速度、时间等信息，能够准确反映城市交通的动态变化。其次，团队利用先进的模拟技术，构建了数字孪生（Digital Twin）城市交通系统，能够在虚拟环境中测试和评估不同的交通策略和干预措施。再者，通过优化算法，团队能够在模拟的基础上，寻找最优的交通管理方案，以减少拥堵、降低排放和提升出行效率。例如，在Green Light项目中，Mobility AI通过优化交通信号灯的控制策略，在多个城市实现了减少车辆停顿次数和降低碳排放的目标。

#神经技术 #城市交通 #人工智能 #数字孪生 #交通优化

阅读更多：

https://research.google/blog/introducing-mobility-ai-advancing-urban-transportation/

AI 驱动科学

机器人看视频学技能：单次观看实现跨形态模仿

康奈尔大学的Kushal Kedia、Sanjiban Choudhury团队开发了RHyME系统，突破人类与机器人动作差异限制，使机器人仅观看一次操作视频就能模仿复杂任务，减少75%训练数据需求。

▷计算机科学博士生库沙尔·凯迪亚（左）和普里特维什·丹是 RHyME 系统开发团队成员。该系统允许机器人通过观看一段操作视频来学习任务。Credit: Louis DiPietro

研究团队提出创新框架RHyME（不匹配执行下的混合模仿检索），通过最优传输算法建立人类视频与机器人动作的语义映射。系统首先分析人类示范视频的嵌入序列（embedding sequences），从机器人记忆库中检索相似片段并重新组合，形成可执行的虚拟教程。在叠餐盘、取杯子等任务中，配备RHyME的机械臂成功率较传统方法提高50%，且能适应双手操作等复杂场景。关键突破在于序列级相似性度量技术，即使人类动作与机器人运动形态迥异，系统仍能识别高层语义关联。

#AI驱动科学 #自动化科研 #跨学科整合 #机器人学习 #模仿学习

阅读更多：

Kedia, Kushal, et al. One-Shot Imitation under Mismatched Execution. arXiv:2409.06615, arXiv, 28 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2409.06615

大脑视觉启发AI革新：Lp-Convolution突破机器视觉瓶颈

如何让AI像人脑一样"聪明"地看世界？基础科学研究所、延世大学和马克斯·普朗克研究所的Jea Kwon、C. Justin Lee等开发出Lp-Convolution技术，通过模拟大脑视觉皮层的高斯分布连接模式，使机器视觉同时具备高精度和低计算成本的优势。

▷大脑视觉皮层的信息处理结构与人工神经网络。Credit: Institute for Basic Science

研究团队采用多变量p-广义正态分布（MPND）构建动态滤波器，取代传统CNN的固定方形卷积核（convolution kernel，图像处理的基本单元）。在CIFAR-100测试中，该方法使RepLKNet模型的分类准确率提升15%，对图像模糊、噪声等数据损坏的鲁棒性提高40%。通过对比小鼠脑数据发现，当滤波器形状接近生物视觉皮层的自然高斯分布时，AI内部神经活动模式与真实大脑的相似度达到82%。这种"可变形卷积"技术尤其擅长处理需要长距离关联的任务，如医学影像中的细微病灶识别。研究发表在 ICLR 2025 上。

#AI驱动科学 #计算模型与人工智能模拟 #机器视觉 #生物启发算法 #自动驾驶

阅读更多：

Kwon, Jea, et al. Brain-Inspired $L_p$-Convolution Benefits Large Kernels and Aligns Better with Visual Cortex. 2024. openreview.net, https://openreview.net/forum?id=0LSAmFCc4p

告别"AI失忆症"！SD-LoRA算法实现终身学习突破

如何让AI像人类一样持续学习而不遗忘？香港城市大学、哈佛大学、西安交通大学和浙江大学的研究人员联合开发了SD-LoRA算法，通过分解神经网络参数的方向和幅值，实现了无需存储历史数据的高效持续学习，解决了AI领域长期存在的"灾难性遗忘"难题。

研究团队提出的SD-LoRA算法将低秩适应（LoRA）矩阵分解为方向（direction）和幅值（magnitude）两个组件。与传统方法不同，SD-LoRA固定已学习任务的方向参数，仅调整幅值权重，完全避免了历史数据存储需求。实验发现，下游任务的最优参数集中在特定方向附近，仅通过调整幅值即可适应新任务。算法还包含两个高效变体：SD-LoRA-RR通过动态降低后续任务矩阵的秩减少参数，SD-LoRA-KD则通过知识蒸馏避免引入新矩阵。在多个基准测试中，SD-LoRA在减少50%参数存储的同时保持最高准确率，且不增加推理开销。理论分析首次从矩阵逼近角度解释了该方法的有效性，证明学习到的参数会逐渐逼近最优解的主成分。研究发表在 ICLR 2025上。

#大模型技术 #预测模型构建 #持续学习 #参数效率 #灾难性遗忘

阅读更多：

https://openreview.net/pdf?id=5U1rlpX68A

AI实现3D游戏零样本迁移，跨游戏直接上手操作

如何让AI智能体具备跨游戏泛化能力？北京大学的Shaofei Cai、Zhancun Mu和Yitao Liang与加州大学洛杉矶分校的Anji Liu团队开发的ROCKET-2智能体，仅在Minecraft上预训练就能直接适应"毁灭战士"、DeepMind Lab和虚幻5引擎等全新3D环境，实现了零样本迁移的突破。

研究团队提出了"跨视角目标对齐"方法，允许人类通过自身视角的分割掩码标注目标物体，智能体则通过两个Transformer模块（非因果的Spatial模块和因果的Temporal模块）理解意图并执行任务。为解决视角差异带来的挑战，团队设计了跨视角一致性损失和目标可见性损失两个辅助训练目标。实验结果显示，该方法在Minecraft任务中达到接近100%的成功率，推理速度比前代提升3-6倍，且无需实时生成分割掩码。最引人注目的是，该智能体首次实现了从Minecraft到其他3D游戏的零样本迁移，在虚幻5引擎等全新环境中也能直接上手操作。

#AI驱动科学 #预测模型构建 #跨学科整合 #3D游戏AI #零样本学习

阅读更多：

Cai, Shaofei, et al. ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment. arXiv:2503.02505, arXiv, 4 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.02505

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、等。