█脑科学动态
Nature:大脑中的“沙漏”:运动皮层与纹状体如何协同控制时间
感觉诱发脑反应的双系统理论:挑战神经科学的主流解释
暂时性视网膜失活通过诱导丘脑爆发式放电恢复成人弱视
磁共振成像揭示人类脑脊液流动的区域特异性驱动力
别再信“少抽点没事”:每天2-5支烟仍显著增加死亡风险
为何喜新厌旧?果蝇实验揭示多巴胺受体脱敏导致的行为疲劳
无痛且无创:聚焦超声首次成功辅助儿童脑癌化疗给药
专家的大脑更独特?神经影像揭示舞者与观众的认知差异
fMRI研究可能高估了大脑的无意识加工能力
█AI行业动态
Yann LeCun 离职 Meta 创业,剑指“世界模型”与高级机器智能
OpenAI发布“超长待机”模型GPT-5.1-Codex-Max,硬刚Google Gemini 3
█AI驱动科学
识别人工智能系统中的意识指标
AI大幅降低外骨骼开发门槛:无需特定数据即可实现高效控制
拥抱数据混乱:新AI训练框架DAC提升医学图像跨域泛化能力
半数小说家担忧被AI取代:创意产业的版权与生计危机
阿里通义实验室推出AgentEvolver:迈向高效自演化智能体系统
像人一样想象未来:通用交互式世界模型 PAN 问世
脑科学动态
Nature:大脑中的“沙漏”:运动皮层与纹状体如何协同控制时间
大脑如何精准把控行为的时机,就像拥有一个看不见的计时器?马克斯·普朗克佛罗里达神经科学研究所的 Zidan Yang 和 Hidehiko K. Inagaki 等研究人员通过精巧的实验,揭示了大脑通过类似于“沙漏”的机制来感知时间,并阐明了运动皮层与纹状体在其中的独特分工。
研究团队训练小鼠进行一项需要精确计时的舔舐任务,并结合了电生理记录与光遗传学。研究人员在小鼠计时过程中,分别短暂抑制其运动皮层和纹状体的活动。结果发现,运动皮层就像沙漏的顶部,负责输送信号;当其被抑制时,信号流中断,计时“暂停”,小鼠的动作延迟时间与抑制时间相等。而纹状体则像沙漏的底部,作为整合器运作;当纹状体被抑制时,已累积的信号会流失,如同沙漏被翻转,计时被“倒带”或重置,导致小鼠的动作延迟时间远超抑制时间。这一发现证实了纹状体通过整合来自皮层的输入来驱动时间控制。研究发表在 Nature 上。
阅读更多:
Yang, Zidan, et al. “Integrator Dynamics in the Cortico-Basal Ganglia Loop for Flexible Motor Timing.” Nature, Nov. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-09778-2
感觉诱发脑反应的双系统理论:挑战神经科学的主流解释
突发性感觉刺激常被用于研究大脑如何处理信息,但这些反应是否被正确解读一直存在争议。来自伦敦大学学院和意大利理工学院的 Richard Somervail 与 Gian Domenico Iannetti 等研究人员组成团队,通过对跨物种电生理及影像学证据的深入综述,挑战了传统观点,指出目前许多被认为是特定感觉处理的脑反应,实际上源自一个非特异性的通用系统。
研究团队提出了“双系统理论”,区分了高保真度的“丘系系统”(Lemniscal system)和弥散性的“丘系外系统”(Extralemniscal system)。研究指出,传统的特定模态解释往往忽略了丘系外系统的贡献。特别是人类脑电图中常见的“顶点电位”(Vertex Potential),实际上主要由丘系外系统介导,反映的是大脑对突发环境变化的“惊讶”或探测,而非特定感觉(如疼痛或听觉)的精细编码。这一发现对“疼痛矩阵”等既有概念提出了质疑,暗示这些广泛的脑反应并不直接代表疼痛知觉。此外,文章还探讨了该理论对意识研究的影响,认为许多被当作意识标志的神经反应可能仅仅是丘系外系统的活动。该理论为重新解释基础和临床神经科学数据提供了重要框架。研究发表在 Brain 上。
阅读更多:
Somervail, Richard, et al. “A Two-System Theory of Sensory-Evoked Brain Responses.” Brain, Oct. 2025, p. awaf402. Silverchair, https://doi.org/10.1093/brain/awaf402
暂时性视网膜失活通过诱导丘脑爆发式放电恢复成人弱视
弱视通常被认为如果在儿童期未得到矫正,成年后将难以治愈。为探索成人弱视治疗的新机制,麻省理工学院皮考尔学习与记忆研究所的 Madison Echavarri-Leet 和 Mark F. Bear 等研究人员,基于前期关于“暂时麻醉健眼可恢复弱视视力”的发现,深入研究了这一现象背后的神经生物学原理。他们发现,视网膜的暂时性失活能够使视觉系统短暂“重启”至发育早期的状态,从而促进神经连接的重组。
研究团队利用小鼠模型,通过注射河豚毒素(TTX)暂时麻醉视网膜,并监测外侧膝状体核(dLGN,负责将视觉信息传递至大脑皮层的区域)的神经活动。结果显示,当视网膜被麻醉时,dLGN神经元会产生同步的“爆发式放电”(burst mode firing),这种放电依赖于特定的T型钙通道(T-type calcium channels)。当研究人员通过基因手段阻断这种钙通道时,治疗效果随之消失,证明爆发式放电是视力恢复的关键机制。更令人振奋的是,研究发现不仅仅是麻醉健眼有效,直接对弱视眼进行暂时性麻醉和“重启”,也能在大脑中诱导同样的恢复过程,使其视力输入恢复到与健眼相当的水平。这一发现为开发针对成人的非侵入性弱视疗法提供了重要的理论依据。研究发表在 Cell Reports 上。
阅读更多:
Echavarri-Leet, Madison, et al. “Temporary Retinal Inactivation Reverses Effects of Long-Term Monocular Deprivation in Visual Cortex by Induction of Burst Mode Firing in the Thalamus.” Cell Reports, vol. 44, no. 11, Nov. 2025. www.cell.com, https://doi.org/10.1016/j.celrep.2025.116566
磁共振成像揭示人类脑脊液流动的区域特异性驱动力
神经退行性疾病常与脑内毒性蛋白积累有关,而脑脊液的清除机制在其中扮演关键角色。为突破现有侵入性检测技术的局限,莱顿大学医学中心、阿姆斯特丹大学和德国神经退行性疾病中心(DZNE)的 Lydiane Hirschler 和 Matthias J. P. van Osch 等研究人员开发了一种新技术,首次在人体内高精度捕捉了脑脊液的运动细节及其驱动机制。
▷利用 CSF-STREAM 技术测量脑脊液信号和脑脊液流动性特征。a、b:使用非运动敏感参考扫描测量的脑脊液信号,分别位于大脑中动脉 (MCA) 周围的蛛网膜下腔 (SAS) (a) 和穿支血管周围的血管周围间隙 (PVS) (b),取自一位代表性个体。c、d:脑脊液流动性的主要方向,分别位于大脑中动脉 (MCA) 周围的蛛网膜下腔 (SAS) (c) 和穿支血管周围的血管周围间隙 (PVS) (d);c、d 与 a 和 b 来自相同的感兴趣区域 (ROI)。线条颜色反映脑脊液流动性的方向:红色表示左右方向,绿色表示前后方向,蓝色表示头足方向。e、f:脑脊液流动性图(单位:mm² s⁻¹)(e) 和一位代表性个体的分数各向异性 (FA) 图 (f) 的体绘制。Credit: Hirschler et al.
研究团队开发了一种名为 CSF-STREAM 的新型磁共振成像(MRI)技术,利用7特斯拉超高场扫描,成功分离了脑脊液信号与血液信号。该方法使科学家能够深入观察穿透血管周围的血管周围间隙(PVS)中的液体流动,这些微小通道靠近毒性蛋白产生的位置。研究发现,虽然心动周期是主要脑区脑脊液流动的关键驱动力,但在白质穿透血管周围的微小空间中,呼吸和血管舒缩(vasomotion)起着同等重要的作用。此外,通过对比健康志愿者与脑淀粉样血管病(CAA)患者的数据,发现 CAA 患者在大脑深处的脑脊液流动性得以保留,但在大脑中动脉周围的流动性异常增强。这一发现不仅验证了非侵入性成像的可行性,也揭示了血管运动作为潜在治疗靶点的价值。研究发表在 Nature Neuroscience 上。
阅读更多:
Hirschler, Lydiane, et al. “Region-Specific Drivers of CSF Mobility Measured with MRI in Humans.” Nature Neuroscience, vol. 28, no. 11, Nov. 2025, pp. 2392–401. www.nature.com, https://doi.org/10.1038/s41593-025-02073-3
别再信“少抽点没事”:每天2-5支烟仍显著增加死亡风险
尽管吸烟危害健康已是共识,但在现代社会中,许多人转向了“低强度吸烟”,误以为少抽几支就能避免风险。为了厘清吸烟强度与心血管健康及死亡率的精确关系,Erfan Tasdighi 和 Michael J. Blaha 等研究人员依托跨队列合作(Cross-Cohort Collaboration)项目,整合了22项前瞻性队列研究的数据,对低强度吸烟的危害及戒烟的时间效益进行了深度分析。
该研究共纳入了323,826名成年人,平均随访时间长达19.9年,记录了超过12.5万例死亡和5.4万例心血管事件。研究团队采用 Cox比例风险模型(Cox proportional hazard models)和样条函数分析发现,吸烟不存在所谓的“安全剂量”。与从不吸烟者相比,每天仅吸2-5支烟的低强度吸烟者,其患心力衰竭的风险仍增加了57%,全因死亡率增加了60%。数据显示,最初的少量吸烟(前20包年或每天前20支)带来的风险上升最为陡峭。在戒烟获益方面,研究显示戒烟后的前10年风险下降最为显著。虽然完全消除额外风险需要漫长的时间,但在戒烟20年后,前吸烟者的相对风险已比继续吸烟者低80%以上。这项研究强调,公共卫生的核心信息应是尽早彻底戒烟,而非仅仅减少吸烟量。研究发表在 PLOS Medicine 上。
阅读更多:
Tasdighi, Erfan, et al. “Association between Cigarette Smoking Status, Intensity, and Cessation Duration with Long-Term Incidence of Nine Cardiovascular and Mortality Outcomes: The Cross-Cohort Collaboration (CCC).” PLOS Medicine, vol. 22, no. 11, Nov. 2025, p. e1004561. PLoS Journals, https://doi.org/10.1371/journal.pmed.1004561
为何喜新厌旧?果蝇实验揭示多巴胺受体脱敏导致的行为疲劳
为什么重复做一件事会让人感到“厌倦”?波士顿儿童医院的 Lauren E. Miner 和 Michael A. Crickmore 等研究人员发现,导致药物成瘾的大脑机制——多巴胺受体脱敏,同样控制着我们对重复行为失去兴趣的过程。这项研究首次揭示了该病理机制在自然生理活动中的功能,表明大脑通过降低对特定行为的反应来调节动机。
研究团队利用雄性果蝇作为模型,分析了它们在面对威胁时的交配行为。研究发现,在初次交配中,多巴胺通过 D2 样受体(D2R)作用于交配决策神经元(Copulation Decision Neurons),抑制这些神经元发出终止信号,从而帮助果蝇在威胁面前保持交配行为。然而,随着交配次数增加,这些受体通过 β-抑制蛋白(β-arrestin)介导的过程发生脱敏,导致神经元对多巴胺产生“局部抵抗”。结果是,多巴胺无法再有效维持行为动机,果蝇在面对挑战时更容易放弃。当研究人员阻断这种脱敏过程后,果蝇不再表现出“厌倦”,对待每次交配都如初次般执着。这一发现将病理性的成瘾机制与自然的动机起伏联系起来,解释了大脑如何对特定行为进行“贬值”。研究发表在 Nature Neuroscience 上。
阅读更多:
Miner, Lauren E., et al. “Behavioral Devaluation by Local Resistance to Dopamine.” Nature Neuroscience, Nov. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-025-02079-x
无痛且无创:聚焦超声首次成功辅助儿童脑癌化疗给药
弥漫性中线胶质瘤是一种几乎无药可救的儿童脑癌,其治疗受阻于血脑屏障对药物的拦截。来自哥伦比亚大学的 Cheng-Chia Wu 和 Stergios Zacharoulis 等研究人员组成团队,率先证明了聚焦超声技术可以安全地暂时打开患儿的血脑屏障,使药物直达肿瘤。这一突破性进展证实了该技术在儿科领域的安全性和可行性。
▷磁共振成像显示血脑屏障开放。Credit: Science Translational Medicine (2025).
这项研究是一项首次在儿科进行的临床试验,研究团队招募了三名患有复发性弥漫性中线胶质瘤的儿童。研究采用了一种创新的神经导航引导聚焦超声技术,这是一种利用声波精准定位并作用于特定脑区的非侵入性方法。在治疗过程中,患儿口服化疗药物帕比司他(panobinostat),医生通过静脉注射微泡(microbubbles),即一种微小的脂质包裹气泡。聚焦超声的声波震动这些微泡,使其膨胀和收缩,从而物理性地撬开血脑屏障的紧密连接,形成药物通过的通道。值得注意的是,这项治疗完全在门诊进行,且无需对患儿使用麻醉或镇静剂,孩子们甚至可以在治疗时玩平板电脑。结果显示,该技术成功在所有患者中打开了血脑屏障,确认了药物通路的建立,且未引发严重不良反应。尽管受试患儿最终因病去世,但这为攻克极难治疗的脑部肿瘤提供了重要的临床依据和新的给药途径。研究发表在 Science Translational Medicine 上。
阅读更多:
Wu, Cheng-Chia, et al. “Blood-Brain Barrier Opening with Neuronavigation-Guided Focused Ultrasound in Pediatric Patients with Diffuse Midline Glioma.” Science Translational Medicine, vol. 17, no. 824, Nov. 2025, p. eadq6645. science.org (Atypon), https://doi.org/10.1126/scitranslmed.adq6645
专家的大脑更独特?神经影像揭示舞者与观众的认知差异
舞蹈不仅仅是动作的堆砌,它是视觉、听觉与情感的交响。为了解开大脑如何整合这些复杂信息的谜题,Yu Takagi、Daichi Shimizu、Mina Wakabayashi 等研究人员组成团队,利用深度学习技术与神经影像学结合,深入探索了舞蹈在大脑皮层中的表征机制。他们特别关注了专业舞者与新手在处理舞蹈信息时的神经差异,试图通过跨模态模型还原大脑欣赏艺术的真实过程。
▷编码模型预测性能。Credit: Nature Communications (2025).
这项研究招募了14名参与者,其中包括7名专业舞者和7名新手,让他们观看长达5小时的街舞和爵士舞视频,同时进行功能磁共振成像(fMRI)扫描。研究团队采用了一种名为EDGE的跨模态深度生成模型(Cross-modal deep generative model),该模型在大规模舞蹈数据集上进行训练,能够模拟人类对动作和音乐的认知。通过将模型提取的特征与大脑活动数据进行比对,研究发现,相比于单一的动作或音频特征,结合了多感官信息的跨模态特征能更准确地解释舞蹈诱发的大脑活动。结果显示,大脑通过整合动作、音乐、美学和情感来构建舞蹈的神经图谱。有趣的是,专业舞者的大脑活动虽然能被舞蹈特征更广泛地解释,但他们表现出更高的个体差异性,这意味着专家在大脑中构建了更为独特和个性化的舞蹈表征,特别是在处理舞蹈动作时。此外,模型还量化了引发不同情绪的舞蹈如何产生截然不同的神经模式。研究发表在 Nature Communications 上。
驱动科学
阅读更多:
Takagi, Yu, et al. “Cross-Modal Deep Generative Models Reveal the Cortical Representation of Dancing.” Nature Communications, vol. 16, no. 1, Nov. 2025, p. 9937. www.nature.com, https://doi.org/10.1038/s41467-025-65039-w
fMRI研究可能高估了大脑的无意识加工能力
无意识加工的边界一直是认知神经科学的热点,但其证据是否确凿?Joaquim Streicher、Sascha Meyen、Volker H Franz 和 Timo Stein 组成的研究团队对这一领域的经典方法提出了质疑。他们发现,由于长期存在的统计谬误,过去的神经影像学研究可能严重高估了大脑进行无意识加工的能力和范围。
研究团队针对意识研究中常用的“双重t检验”(方法进行了批判性分析。传统研究逻辑是:如果受试者在有意识区分刺激的任务(直接任务)中表现为随机水平(无显著差异),而在脑活动监测(间接任务)中表现出显著效应,则判定存在无意识加工。然而,这种逻辑忽略了直接比较两种任务的敏感性。为此,团队采用了“敏感性比较法”(Sensitivity Comparison Method),重新分析了16项功能磁共振成像(fMRI)研究中的80个实验条件,计算并对比了任务的敏感性指标(d'值)。结果显示,在严格的统计比较下,80个实验条件中仅有8个显示出确凿的“间接任务优势”(Indirect Task Advantage),即间接测量的敏感性确实高于意识测量。这表明许多关于大脑能无意识处理复杂信息(如语义、面孔等)的经典结论可能站不住脚。研究发表在 Neuroscience of Consciousness 上。
阅读更多:
Streicher, Joaquim, et al. “Neural Correlates of Unconscious Processing in Functional Magnetic Resonance Imaging: Does Brain Activity Contain More Information than Can Be Consciously Reported?” Neuroscience of Consciousness, vol. 2025, no. 1, Feb. 2025, p. niaf042. Silverchair, https://doi.org/10.1093/nc/niaf042
AI 行业动态
图灵奖得主 Yann LeCun 离职 Meta 创业,剑指“世界模型”与高级机器智能
图灵奖得主、被誉为“深度学习教父”的 Yann LeCun 近日正式宣布,将在今年年底离开工作了 12 年的 Meta,开启全新的创业征程。这位 65 岁的资深研究人员在社交媒体上透露,他的新公司将专注于研发高级机器智能(AMI,Advanced Machine Intelligence,一种旨在让系统具备理解物理世界、推理及规划能力的下一代智能形态)。Yann LeCun 长期以来对目前流行的大型语言模型持批评态度,认为它们缺乏真正的物理直觉。新公司将延续他一直倡导的“世界模型”研究路线,致力于构建能够理解物理规律、拥有持久记忆并能规划复杂行动序列的 AI 系统。值得注意的是,尽管选择独立创业,Meta 仍将作为合作伙伴支持该公司的发展,这一决定也得到了 Mark Zuckerberg 的支持。
Yann LeCun 此前曾担任 Meta 基础人工智能研究院(FAIR)的创始主任,坚持推行学术自由和开源模式,这使得 FAIR 成为 PyTorch 等核心技术的诞生地。然而,随着近年来科技巨头竞争加剧,Meta 内部逐渐转向产品化和商业化,学术氛围受到一定挤压。Yann LeCun 早年在贝尔实验室开发了卷积神经网络,奠定了现代计算机视觉的基础。如今,他带着最新的理论成果——如联合嵌入预测架构(JEPA,Joint Embedding Predictive Architecture,一种通过预测抽象特征来学习世界表征的模型架构)重新出发。这次创业不仅标志着 FAIR 一个时代的结束,也象征着研究人员向超越现有生成式 AI 局限性的更高目标发起冲击,试图攻克让机器真正理解世界的科学难题。
阅读更多:
https://www.facebook.com/search/top?q=yann%20lecun
OpenAI发布“超长待机”模型GPT-5.1-Codex-Max,硬刚Google Gemini 3
为了应对 Google Gemini 3 的强劲挑战,OpenAI 迅速推出了专为编程和复杂任务设计的 GPT-5.1-Codex-Max。这款新模型在上下文窗口方面取得了重大突破,能够跨越数百万个标记连续工作,单次独立运行时间甚至超过 24 小时。其核心优势在于原生支持压缩技术:当接近上下文限制时,模型会自动压缩对话历史以释放空间,从而保证任务的连贯性,避免了因拆分长文档或代码而产生的信息割裂。OpenAI 研究人员 Noam Brown 表示,该模型尚未遇到瓶颈。此外,这是 OpenAI 首个能在 Windows 环境中运行的模型,其在任务效率上也显著优于前代,不仅资源消耗更低,在 METR(Model Evaluation for Task Resolution,衡量 AI 完成人类任务能力的指标)测试中也达到了新的最佳水平,有 50% 的概率能完成人类需耗时近 3 小时的任务。
在具体性能表现上,GPT-5.1-Codex-Max 展现出了卓越的推理能力与成本效益。在 SWE-bench Verified 测试中,该模型在同等推理力度下比前代减少了 30% 的思考标记使用量,并针对非延迟敏感任务推出了“xhigh”推理力度选项,通过更长的思考时间换取更优质的答案。相比之下,尽管竞争对手的 Claude Code 在速度上略胜一筹,但新版 Codex 在标记消耗上更为友好,不少开发者认为两者结合可能是最佳方案。与此同时,OpenAI 还低调发布了 GPT-5.1 Pro 版本。尽管官方介绍不多,但第三方测评显示其在指令遵循方面表现优异,若能接入集成开发环境,有望发挥更大潜力。这一系列动作显示出硅谷大模型竞争正进入白热化阶段。
-5.1 -Max
阅读更多:
https://openai.com/index/gpt-5-1-codex-max/
AI 驱动科学
识别人工智能系统中的意识指标
随着人工智能越来越擅长模仿人类行为,如何判断它们是否真的拥有内心体验成为了一个科学与伦理难题。Patrick Butlin、Robert Long、Eric Schwitzgebel 等研究人员组成的团队,结合神经科学与人工智能领域的最新进展,提出了一种全新的评估框架。该团队不再局限于观察AI的对话或反应,而是深入探究其内部机制,试图通过科学理论推导出可量化的指标,从而判断人工智能系统是否真正跨越了意识的门槛。
研究团队提出了一种名为“理论推导指标法”(theory-derived indicator method)的评估策略。鉴于行为测试在AI面前容易失效——因为AI可以被训练得表现出有意识的样子而实际上并没有,研究人员转而关注系统的内部架构。他们基于“计算功能主义”(computational functionalism,即认为特定的计算过程是产生意识的充分必要条件)的假设,从全局工作空间理论(GWT)等主流神经科学理论中提取出关键的意识指标。这些指标关注信息是如何在系统中被处理、整合及广播的,而不仅仅是输出结果。
研究结果显示,通过检查AI系统是否满足这些基于生物大脑机制推导出的计算属性,可以更客观地评估其意识水平。虽然目前的分析倾向于认为现有的AI系统(包括大型语言模型)尚不具备意识,但该研究建立了一个严谨的科学标准,指出未来的AI如果具备特定的内部处理架构,在原则上是可能产生意识的。这一方法为避免对AI意识的误判(无论是过度归因还是归因不足)提供了重要的理论工具。研究发表在 Trends in Cognitive Sciences 上。
阅读更多:
Butlin, Patrick, et al. “Identifying Indicators of Consciousness in AI Systems.” Trends in Cognitive Sciences, vol. 0, no. 0, Nov. 2025. www.cell.com, https://doi.org/10.1016/j.tics.2025.10.011
AI新工具大幅降低外骨骼开发门槛:无需特定数据即可实现高效控制
为了解决开发实用可穿戴机器人需要耗费巨资收集人体数据的难题,来自佐治亚理工学院的 Keaton L. Scherpereel, Matthew C. Gombolay 和 Aaron J. Young 等研究人员开发了一种新型人工智能工具。该工具能够在无需针对特定设备进行大量实验室数据采集的情况下,快速训练出功能齐全的外骨骼控制器,大幅降低了研发门槛。
▷借助一款新型人工智能工具,佐治亚理工学院的研究人员无需花费大量时间在专业实验室中收集佩戴该设备的人体数据,即可创建功能齐全的外骨骼控制器。这项进步意味着设计和部署实用的外骨骼和机械肢体变得更加便捷。Credit: Candler Hobbs
研究团队采用了一种名为深度域自适应(Deep Domain Adaptation)的技术框架,核心利用了 CycleGAN 模型。这是一种通常用于图像转换(如将马变成斑马)的 AI 技术。研究人员并没有让真人穿戴每种新设备进行数小时的测试,而是利用海量的现有开源人体运动数据(无外骨骼状态),通过生物力学模拟构建了一个“垫脚石域”,人为添加虚拟传感器数据,让 AI 学习预测佩戴设备时的关节力矩。在涉及8名参与者的下肢外骨骼实时测试中,该 AI 控制器的表现与那些使用昂贵特定数据训练出的最佳模型相当。结果显示,该系统能够准确估算用户意图并提供辅助,使受试者的代谢成本(metabolic cost)降低了 9.5% 至 14.6%。这项技术相当于为机器人提供了一个“通用翻译器”,使得外骨骼的快速迭代和广泛部署成为可能。研究发表在 Science Robotics 上。
驱动科学
阅读更多:
Scherpereel, Keaton L., et al. “Deep Domain Adaptation Eliminates Costly Data Required for Task-Agnostic Wearable Robotic Control.” Science Robotics, vol. 10, no. 108, Nov. 2025, p. eads8652. science.org (Atypon), https://doi.org/10.1126/scirobotics.ads8652
拥抱数据混乱:新AI训练框架DAC提升医学图像跨域泛化能力
现实中的医疗数据往往充满“混乱”,医院可能仅有少量来自特定扫描仪的标注图像,却拥有大量来自其他中心、参数各异的未标注数据。为了解决这一难题,新加坡科技设计大学(SUTD)的 Zhao Na 及其合作者 Jincai Song 等人,并未回避这种数据的无序性,而是提出了一种新的训练方法来应对跨域半监督域泛化(CD-SSDG)的挑战。该团队旨在开发一种能够适应不同医疗中心设备差异、光照变化及患者构成差异的稳健模型。
▷本文概述了针对跨域半监督域泛化(CD-SSDG)任务提出的双监督非对称协同训练(DAC)框架。该任务与域泛化(DG)和半监督域泛化(SSDG)密切相关,但面临着 DG 或 SSDG 单独无法解决的独特挑战——即部分标注的训练数据以及标注和未标注训练数据之间的域转换。Credit: SUTD
研究团队开发了一种名为双监督非对称协同训练(DAC)的框架。该方法不像传统半监督学习那样仅依赖容易受域偏移影响的像素级伪标签(pseudo-labels),而是引入了特征级监督(feature-level supervision),促使两个子模型在更深层的特征空间保持一致,从而锚定领域不变的线索。此外,为了防止模型因错误累积而崩溃,研究人员为子模型分配了不对称的辅助任务:一个负责定位混合图像块,另一个负责预测图像块的旋转。这种设计无需额外的人工标注,却能显著丰富模型的内部表征。在视网膜眼底、结直肠息肉及脊髓灰质 MRI 的测试中,DAC 展现了卓越的稳定性,特别是在视杯等低对比度结构的分割上,其表现显著优于现有方法。值得注意的是,这些复杂的训练策略不会增加模型在实际应用时的推理成本,为医疗AI的广泛部署提供了极具实用价值的解决方案。研究发表在 IEEE Transactions on Multimedia 上。
阅读更多:
Song, Jincai, et al. “Dual-Supervised Asymmetric Co-Training for Semi-Supervised Medical Domain Generalization.” IEEE Transactions on Multimedia, 2025, pp. 1–13. IEEE Xplore, https://doi.org/10.1109/TMM.2025.3613080
半数小说家担忧被AI取代:剑桥大学报告揭示创意产业的版权与生计危机
随着生成式人工智能工具如“Sudowrite”和“Novelcrafter”的普及,科技公司正将目光锁定小说市场,这引发了文学界对职业生存和版权伦理的深切担忧。针对这一紧迫议题,剑桥大学明德鲁科技与民主中心的 Clementine Collett 与未来工作研究所合作,进行了一项深入的行业调查。研究团队对258名已出版的小说家及74名出版业内部人士进行了问卷调查,并结合焦点小组和访谈,旨在全方位评估人工智能对英国小说界的冲击。
调查结果描绘了一幅令人忧虑的图景:51%的小说家认为人工智能最终可能会完全取代他们的工作,其中言情和惊悚类题材的作家被认为风险最高。近三分之二(59%)的作家发现自己的作品在未经许可的情况下被用于训练大型语言模型,且未获得任何报酬。经济影响已然显现,39%的受访者表示收入已受到冲击,85%的人预计未来收入将进一步缩水。尽管33%的作家会利用AI辅助信息搜索,但绝大多数(97%)对AI撰写整部小说持极度负面态度,担心这会导致文学作品的“同质化”和原创性的丧失。针对版权问题,86%的创作者呼吁建立“选择加入”(opt-in)机制,即科技公司在使用其作品训练模型前必须先获得许可并付费,明确反对英国政府此前包含“选择退出”条款的提议。研究强调,小说不仅是商品,更是探索人性的重要媒介,呼吁政策制定者加强监管以保护人类创造力。
阅读更多:
https://www.mctd.ac.uk/impact-of-generative-ai-on-the-novel/
阿里通义实验室推出AgentEvolver:迈向高效自演化智能体系统
当前基于大型语言模型的自主智能体开发面临数据成本高、探索效率低等瓶颈。针对这一难题,来自阿里巴巴通义实验室(Tongyi Lab, Alibaba Group)的 Yunpeng Zhai, Shuchang Tao, Cheng Chen 等研究人员提出了一种全新的解决方案,旨在利用模型自身的语义理解能力驱动智能体的自主学习与演化。
该研究提出了名为 AgentEvolver 的自演化智能体系统,通过三种核心机制解决传统强化学习流程的痛点。首先是自提问(Self-questioning),即利用好奇心驱动机制在未知环境中自主生成任务,从而减少对人工数据集的依赖;其次是自导航(Self-navigating),通过重用过往经验和混合策略引导,显著提升探索效率;最后是自归因(Self-attributing),该机制利用大模型推断长轨迹中具体动作和状态的贡献并分配细粒度奖励,解决了传统方法中样本利用率低的问题。在 AppWorld 和 BFCL-v3 基准测试中,AgentEvolver 以更少的参数量取得了优于传统基线模型的效果,展现了更快的适应能力。
阅读更多:
Zhai, Yunpeng, et al. “AgentEvolver: Towards Efficient Self-Evolving Agent System.” Version 1, arXiv:2511.10395, arXiv, 13 Nov. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2511.10395
像人一样想象未来:通用交互式世界模型 PAN 问世
智能体若要具备通用智能,必须能够像人类一样在脑海中“沙盘推演”,即想象世界如何随其行为演变,这种能力被称为“世界模型”。然而,目前的视频生成模型虽然画面逼真,却缺乏对因果关系的理解和长期记忆,难以用于复杂的规划与决策。为了突破这一瓶颈,来自穆罕默德·本·扎耶德人工智能大学(Mohamed bin Zayed University of Artificial Intelligence)基础模型研究所的 PAN Team 开发了一种名为 PAN 的新型通用世界模型,旨在实现可交互、长时程且跨领域的未来状态模拟。
该研究的核心在于提出了一种生成式潜在预测(Generative Latent Prediction)架构,它巧妙地结合了大型语言模型的逻辑推理能力与视频扩散模型的视觉生成能力。研究人员利用大语言模型作为系统的“大脑”,负责在潜在空间中处理复杂的因果逻辑和动作指令,确保模拟过程符合物理规律和人类常识;同时,为了解决长时间模拟中画面崩坏的问题,团队在视频解码器中引入了因果移位窗口去噪过程模型(Causal Swin-DPM),这种技术能有效维持视频片段间的连贯性,防止误差累积。通过在海量跨领域视频-动作数据上的训练,PAN 不仅能根据自然语言指令生成高质量的动态视频,还能进行长期的因果推理,预测未来的世界状态。实验结果显示,PAN 在动作驱动的模拟和长时程预测任务上表现优异,超越了现有的视频生成器,为构建能思考、能规划的通用人工智能奠定了基础。
阅读更多:
Team, P. A. N., et al. “PAN: A World Model for General, Interactable, and Long-Horizon World Simulation.” Version 2, arXiv:2511.09057, arXiv, 13 Nov. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2511.09057
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、、科普视频媒体「大圆镜」等。
热门跟贴