追问daily | 深度学习的牛顿定律；为什么更快的AI并不总是更好？|人工智能|牛顿(布莱克)|牛顿定律|疾病预防|神经网络|算法|运动

█ 脑科学动态

Nature：“为母则刚”的神经可塑性：哺乳期大脑如何强化攻击回路

Nature：反向神经元群——解码全脑血容量波动的关键密码

新型荧光纳米抗体技术实现高精度、低背景的活细胞成像

个体大脑的运作方式与群体平均结果截然相反

Cheese3D：AI视觉系统实现小鼠面部表情高精度3D追踪

身体运动驱动大脑内液体流动

全身超声断层扫描技术可在10秒内获取完整横截面图像

无标记光学成像结合深度学习首次量化人脑钩束微观结构

激化赢者通吃效应！中间神经元如何筛选大脑关键信息

█ AI行业动态

DeepSeek V4实测：编程碾压、推理翻车？

美国批准首个基因疗法，有望治愈罕见遗传性耳聋

年收入首超OpenAI！Anthropic获谷歌400亿美元天价投资

█ AI驱动科学

Nature：评估标准导致AI“胡说八道”

新型人工视网膜不仅恢复视力，还能赋予近红外视觉

利用端到端AI框架实现RNA翻译可编程控制

AI算法trRosettaRNA2，精准预测RNA三维结构与动态构象

智能超材料纺织品实现无电池连续血压监测

为什么更快的AI并不总是更好：延迟反而提升用户感知质量

Google DeepMind推出通用视觉基础模型Vision Banana

苹果新研究揭示大模型隐私隐患：你的Logits知道些什么？

深度学习的牛顿定律：14名顶尖学者提出学习力学统一理论框架

脑科学动态

Nature：“为母则刚”的神经可塑性：哺乳期大脑如何强化攻击回路

“为母则刚”背后的神经机制长期以来是未解之谜。纽约大学朗格尼医学中心的Dayu Lin团队通过研究哺乳期小鼠，揭示了一条从后侧杏仁核到下丘脑的关键神经通路，并阐明了催产素如何根据幼崽需求精准调控该通路，从而动态控制母性攻击行为的开启与关闭。

研究团队首先锁定了一条关键神经通路：从后侧杏仁核（PA）中表达雌激素受体α的细胞，投射到腹内侧下丘脑的腹外侧区（VMHvl）中表达神经肽Y受体2（Npy2r）的细胞。实验证实，在哺乳期间，这条通路的突触连接会增强，下游神经元的兴奋性也更高，这共同构成了母性攻击升级的生理基础。更有趣的是，被称为“爱的激素”的催产素是这一过程的动态“调节阀”。研究发现，上游的PAEsr1神经元富含催产素受体。当幼崽在身边时，它们的吮吸等行为会促使母体释放催产素，从而激活这条攻击通路；一旦幼崽被移走，催产素水平下降，攻击性也随之减弱。研究人员通过光遗传学技术人为提升催产素水平，成功恢复了母鼠的攻击行为，证实了这一因果关系。该通路高度特化，不影响交配等其他社会行为，揭示了大脑为保护后代进化出的精密调控系统。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #母性行为 #催产素 #社会行为

阅读更多：

Yamaguchi, Takashi, et al. “The Neural Mechanisms Supporting the Rise and Fall of Maternal Aggression.” Nature, Apr. 2026, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-026-10354-5

Nature：反向神经元群——解码全脑血容量波动的关键密码

传统观点认为脑血流依赖于区域整体神经活动，但这种关系在不同脑区和状态下似乎存在差异。伦敦大学的Agnès Landemard团队通过同步检测小鼠全脑神经元活动与血容量，发现决定血流的并非整体活动，而是两类功能相反、广泛分布于全脑的神经群体。

研究团队创新性地结合了功能性超声成像（functional ultrasound imaging, fUSI）和大规模神经记录技术（Neuropixels probes），首次在全脑尺度上同步观测了小鼠的血容量变化和单个神经元的活动。他们发现，以胡须抽动为标志的觉醒状态变化，会引起全脑血容量的高度同步波动。研究的核心发现是，大脑中普遍存在两类与觉醒状态完全相反的神经元：一类是“觉醒增强型”，在觉醒时活动增强；另一类是“觉醒抑制型”，在觉醒时活动减弱。这两类神经元群体与血流的耦合方式截然不同，拥有各自独立的血流动力学响应函数（hemodynamic response functions）。基于这一发现，研究人员构建了一个双神经元模型，该模型通过整合这两类神经元的贡献，能够极其精准地预测不同脑区和不同状态下的血容量波动，其预测能力远超依赖于整体神经活动的传统模型。这一结果表明，不同脑区血容量看似迥异的波动模式，实际上是由这两类神经元在各脑区的不同比例决定的。研究发表在 Nature 上。

#疾病与健康 #神经机制与脑功能解析 #神经血管耦合 #觉醒状态

阅读更多：

Landemard, Agnès, et al. “Brainwide Blood Volume Reflects Opposing Neural Populations.” Nature, Apr. 2026, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41586-026-10350-9

新型荧光纳米抗体技术实现高精度、低背景的活细胞成像

如何清晰地“看清”活细胞内部的微观世界？传统荧光成像技术常因背景噪声而受限。索尔克研究所的Axel Nimmerjahn、阿尔伯特·爱因斯坦医学院的Vladislav V. Verkhusha及其合作团队，开发了一种名为可见光谱抗原稳定荧光纳米抗体（VIS-Fbs）的新型成像平台，能够以极高的信噪比实时追踪活体内的分子活动。

▷ 小鼠脑组织显示抑制性神经元，这些神经元用红色荧光标记物 VIS-Fb 标记，该标记物可与绿色钙生物传感器结合。神经元以蓝色突出显示。Credit: Barykina et al.

研究团队设计出一种“智能”探针，它由能够特异性结合靶蛋白的纳米抗体和荧光蛋白构成。其核心创新在于，这种探针只有在与目标结合后才会稳定并被“点亮”，从而将背景荧光降低了近百倍，使得成像前所未有地清晰。此外，团队还开发了一整套覆盖从蓝色到远红色的多色探针，并设计出可通过光照“开启”或“关闭”的变体，这使得在复杂生命系统中同时追踪多个分子并进行高时空精度的动态观察成为可能。研究人员在小鼠大脑和斑马鱼胚胎等模型中成功验证了该技术的强大功能，例如，在小鼠行为过程中精确监测了神经元和星形胶质细胞的钙活动，并实时追踪了斑马鱼发育过程中的蛋白动态。这项技术为细胞信号传导、胚胎发育和疾病进展等研究领域提供了强大的新工具。研究发表在 Nature Methods 上。

#疾病与健康 #神经机制与脑功能解析 #细胞成像 #纳米抗体

阅读更多：

Barykina, Natalia V., et al. “Synthetic Multicolor Antigen-Stabilizable Nanobody Platform for Intersectional Labeling and Functional Imaging.” Nature Methods, Apr. 2026, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41592-026-03056-3

个体大脑的运作方式与群体平均结果截然相反

大脑研究中常用的“平均法”是否可靠？斯坦福大学医学院的Vinod Menon, Percy K. Mistry, Nicholas K. Branigan等研究人员对超过4000名儿童的脑成像数据进行分析，发现群体平均结果会严重误导我们对个体大脑工作方式的理解。该研究指出，个体在执行任务时的脑活动模式与群体平均模式可能完全相反，揭示了神经科学领域存在的“辛普森悖论”。

研究团队利用功能性磁共振成像（fMRI）技术，分析了儿童在执行一项抑制性认知控制任务时的脑活动。他们对比了两种分析方法：一种是传统的群体平均法，另一种是追踪每个孩子在多次重复任务时的脑活动动态。结果显示出惊人的差异：例如，在群体层面，较慢的反应速度与默认模式网络的活动增强有关。然而，在个体层面，当一个孩子反应变慢时，该网络的活动反而会减弱——这与群体结论完全相反。这种个体与群体规律的背离现象被称为非遍历性。此外，通过个体化分析，研究还成功区分了主动控制（如提前准备抑制行为）和反应控制（如实际执行抑制）的不同神经回路，并发现认知策略不同的儿童亚组（例如，犯错后能调整策略的儿童与不能调整的儿童）其大脑动态也截然不同。这一发现挑战了神经科学研究的传统范式，强调了“平均大脑”并不存在，对于理解和干预注意力缺陷/多动障碍（ADHD）等疾病具有重要意义。研究发表在 Nature Communications 上。

#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #认知科学

阅读更多：

Mistry, Percy K., et al. “Nonergodicity and Simpson’s Paradox in Neurocognitive Dynamics of Cognitive Control.” Nature Communications, vol. 17, no. 1, Apr. 2026, p. 3494. www.nature.com, https://doi.org/10.1038/s41467-026-71404-0

Cheese3D：AI视觉系统实现小鼠面部表情高精度3D追踪

如何量化面部表情与大脑活动之间的微妙联系？冷泉港实验室（CSHL）的Xun Helen Hou及其同事Kyle Daruwalla、Irene Nozal Martin等人为此开发了一个名为Cheese3D的创新平台。这个结合了多摄像头阵列和人工智能的系统，能够以前所未有的精度捕捉和分析小鼠的全脸动态，为神经科学和医学研究提供了强大的新工具。

研究团队构建的Cheese3D系统使用六个微型摄像头从不同角度同步拍摄小鼠，再通过机器学习算法将视频融合成高精度的三维面部模型。该系统能够以亚毫米级的精度追踪耳朵、眼睛、胡须垫和下颌等关键部位的动态，并将其量化为有解剖学意义的几何特征。为了验证其有效性，研究人员进行了一系列实验。最引人注目的是，他们发现仅通过分析面部肌肉张力的细微变化，Cheese3D就能非侵入性地预测小鼠的麻醉深度，其准确性与黄金标准的脑电图方法相媲美。该系统还能捕捉到进食时的快速动作和由脑干刺激引发的微小反应。这项技术将小鼠微妙的“脸色”转化为一个高信息密度的窗口，为研究情绪、疾病（如孤独症）和认知发育过程中的大脑活动提供了全新视角。研究发表在 Nature Neuroscience 上。

#AI驱动科学 #自动化科研 #神经机制与脑功能解析 #计算机视觉

阅读更多：

Daruwalla, Kyle, et al. “Cheese3D Enables Sensitive Detection and Analysis of Whole-Face Movement in Mice.” Nature Neuroscience, Apr. 2026, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41593-026-02262-8

身体运动驱动大脑内液体流动

运动为何能健脑？宾夕法尼亚州立大学的Patrick J. Drew和Francesco Costanzo团队揭示了一种全新的生物力学机制。他们发现，大脑与身体的机械连接远比我们想象的更紧密，腹部肌肉的收缩能像液压泵一样，通过血管网络直接驱动大脑在颅骨内发生微小位移，从而促进脑脊液流动，为清除大脑代谢废物提供了物理动力。

▷ 研究人员利用双光子显微镜（一种能够对活体组织进行高分辨率成像的技术）观察了小鼠在运动前、腹部肌肉收紧（促使身体进一步运动）之后大脑的动态变化。左图显示的是静止状态下的大脑（绿色部分），右图则显示了运动过程中的大脑活动。Credit: Penn State

研究团队利用双光子显微镜对清醒小鼠进行活体成像，发现大脑的微小运动与身体活动（如行走）紧密相关，且这种运动往往在肢体移动之前、伴随着腹部肌肉的收缩而发生。为了验证这一因果联系，研究人员对麻醉小鼠的腹部施加轻微压力，也观察到了同样的大脑位移。结合微型计算机断层扫描的观察，他们证实了这一“液压”机制：腹部收缩压迫椎静脉丛，使血液被推入脊髓腔，进而对大脑施加压力，导致其轻微移动。随后，团队通过建立大脑的“海绵”计算模型进行模拟，结果表明这种由身体运动驱动的脑部“摇摆”，能够有效促进脑脊液的循环，从而可能加速清除阿尔茨海默病等神经退行性疾病相关的有害废物。研究发表在 Nature Neuroscience 上。

#疾病与健康 #神经机制与脑功能解析 #脑脊液 #运动 #神经退行性疾病

阅读更多：

Garborg, C. Spencer, et al. “Brain Motion Is Driven by Mechanical Coupling with the Abdomen.” Nature Neuroscience, Apr. 2026, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41593-026-02279-z

全身超声断层扫描技术可在10秒内获取完整横截面图像

为解决传统超声检查视野窄、依赖操作者等问题，加州理工学院的Lihong Wang团队开发了一套全新的全身超声断层扫描系统。该系统实现了快速、安全且无需操作员干预的完整人体横截面成像，其图像质量可与核磁共振（MRI）媲美，为临床诊断和监测提供了强大的新工具。

▷ 健康成年女性（参与者 1）的横断面超声检查结果。Credit: Nature Biomedical Engineering (2026).

研究团队设计了一个浸入式成像系统，受试者坐在水箱中，周围环绕一个由512个换能器组成的环形阵列。该设备可在10秒内完成对腹部等部位的360度扫描，获得完整的横截面图像。与传统超声仅依赖回声不同，该系统还测量透射信号，通过分析声速和声衰减（signal attenuation，指声波能量在组织中被吸收或偏转的程度）来更精确地区分不同组织。在健康志愿者身上的测试证实，其成像结果与3T MRI高度一致，但避免了电离辐射和组织压缩。该技术在监测脂肪肉瘤、评估脂肪分布和引导活检等方面展现出巨大潜力，未来有望通过改进设计（如水平床式）应用于手术实时引导。研究发表在 Nature Biomedical Engineering 上。

#疾病与健康 #疾病预防 #医学影像 #超声断层扫描 #无创诊断

阅读更多：

Garrett, David C., et al. “Whole Cross-Sectional Human Ultrasound Tomography.” Nature Biomedical Engineering, Apr. 2026, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41551-026-01660-4

无标记光学成像结合深度学习首次量化人脑钩束微观结构

针对难以在死后人脑组织中精准观测白质通路微观结构的问题，Kelly Perlman 等研究人员成功开发了一种新型的生物光学成像与分析流程，并利用该技术平台首次对人脑钩束中的轴突大小和髓鞘厚度进行了大规模的定量测量。

▷ 一种新型的无标记成像和分析流程将光谱聚焦相干反斯托克斯拉曼光谱（sf-CARS）与基于深度学习的分割技术相结合，用于研究死后人脑组织中的髓鞘。使用定制训练的 AxonDeepSeg 模型进行分割的示例从原始 sf-CARS 图像（左上）中区分出轴突和髓鞘（右上），表明该系统能够评估人脑组织中的髓鞘（下）。Credit: K. Perlman, V. P. Noel, A. Collin, et al.

传统的电子显微镜在处理存在降解问题的死后脑组织时往往效果不佳。为此，研究团队采用光谱聚焦相干反斯托克斯拉曼光谱（sf-CARS，一种利用超快激光脉冲检测组织内分子自然振动从而实现无标记成像的高级光学技术）来直接捕获富含脂质的髓鞘图像，而无需使用任何化学染色剂。为了从高分辨率图像中大规模提取定量数据，研究人员引入了定制的分割模型。通过主动学习策略不断纠正和重新训练模型，并结合自动化质量控制步骤剔除不合理的几何形状，该流程最终成功分析了来自六名健康个体的2600多个有髓轴突。测量结果显示，钩束颞段的轴突平均直径约为0.93微米，平均髓鞘厚度约为0.48微米。研究还通过分析g比率（g-ratio，衡量髓鞘相对于其包裹的轴突厚度的标准指标），发现钩束内的神经纤维比前扣带回皮层的白质具有更厚的髓鞘和更低的比率，这契合了大脑在长距离连接中需要快速传输电信号的生物学特征。该无标记方法的建立为未来研究精神或神经疾病患者的死后脑组织结构提供了极具价值的实用基础。研究发表在 Biophotonics Discovery 上。

#神经科学 #神经机制与脑功能解析 #无标记光学成像 #白质微观结构 #深度学习

阅读更多：

Perlman, Kelly, et al. “Ultrastructural Analysis of Human Uncinate Fasciculus with Coherent Anti-Stokes Raman Spectroscopy.” Biophotonics Discovery, vol. 3, no. 2, Mar. 2026, p. 025002. www.spiedigitallibrary.org, https://doi.org/10.1117/1.BIOS.3.2.025002

激化赢者通吃效应！中间神经元如何筛选大脑关键信息

抑制性环路如何调控海马信息编码一直是未解之谜。Thomas Hainmueller与György Buzsáki及其团队（纽约大学朗格尼医学中心）首次在自由活动小鼠中揭示，中间神经元能通过激化赢者通吃网络动态，筛选出关键的神经元集群以支持记忆等核心认知功能。

研究团队结合了电生理记录与双向光遗传学技术，在自由活动的小鼠中收集神经活动数据。研究利用机器学习算法，基于电生理特征将海马齿状回的细胞划分为主细胞和两类主要的中间神经元，即小清蛋白（parvalbumin，一种与快速神经信号传导相关的钙结合蛋白）和生长抑素（somatostatin，一种起抑制性调节作用的多肽类激素）表达神经元。结果表明，这两类神经元展现出不同的突触连接模式，前者主要调控反馈抑制，而后者控制内嗅皮层输入的门控。更令人意外的是，当激活中间神经元时，并未产生单纯抑制周围网络的效应。相反，这种操作激化了赢者通吃网络（winner-take-all network，一种竞争机制，仅激活程度最高的神经元群能产生输出而其余被抑制）的动态特性。少数主细胞出现矛盾性的多突触兴奋，其放电增加量足以抵消其他细胞的放电减少量，导致整体神经群体平均放电率不降反升。这一机制使得大脑能在认知过程中有效筛选携带信息的神经集群。研究发表在 Neuron 上。

#神经科学 #神经机制与脑功能解析 #海马齿状回 #光遗传学 #认知机制

阅读更多：

Hainmueller, Thomas, et al. “Dentate Gyrus Interneurons Modulate Winner-Take-All Network Dynamics in Freely Behaving Mice.” Neuron, vol. 0, no. 0, Apr. 2026. www.cell.com, https://doi.org/10.1016/j.neuron.2026.03.034

AI 行业动态

DeepSeek V4实测：编程碾压、推理翻车？

国产AI明星DeepSeek近日发布新一代开源模型V4系列，包含主打极致性能的V4 Pro和更轻量快速的V4 Flash两个版本。相比前代V3，V4将上下文窗口从128K大幅扩展至1M（百万），并宣称其自主代理编程能力已达到开源模型中的最强水平，推理性能与知识储备也获得全面升级。实测显示，V4能快速搭建风格化的主题网站、生成包含游戏规则与经济系统的在线小游戏原型，甚至在“镜子举手”这类误导性推理题中表现优于ChatGPT-5.5。不过，在面对“亲生父母结婚”等文字陷阱以及部分遗传学逻辑题时，V4的首次反应仍显“真诚”有余而精准不足，需额外提示才能走上正轨。

此次更新不仅在硬核能力上引发关注，还带来了模型“性格”的显著变化。此前因一次小版本更新而变得机械冷漠的DeepSeek（被网友称为“D老师”），在V4中重新展现出丰富的情感色彩，能够输出千字安慰小作文，让用户感到熟悉的陪伴感回归。V4 Flash版本在编程场景中表现不输Pro版，且提供更经济快捷的API服务，适合快速创意验证。尽管在部分知识截止日期和封闭推理上仍有瑕疵，但整体上V4系列凭借强大的开源性能、多模态前端生成能力以及情感交互的提升，再次证明了DeepSeek搅动AI圈的实力。

#DeepSeekV4 #开源模型 #Agent编程 #推理能力 #情感AI

阅读更多：

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/

ICLR 2026揭晓获奖论文：Transformer简洁性研究与多轮对话困境获杰出奖，DCGAN与DDPG斩获时间检验奖

机器学习顶级会议ICLR 2026近日在巴西里约热内卢举行，公布了本届获奖论文。在约19000篇有效投稿中，两篇研究获“杰出论文奖”（Outstanding Paper Paper Award）。第一篇 Transformers are Inherently Succinct 从理论角度揭示，Transformer架构在表示某些概念时具有远超有限自动机或线性时序逻辑（LTL，一种描述系统行为随时间变化的逻辑语言）等标准方法的简洁性，但这种强表达能力也导致对其性质的验证在理论上不可处理（EXPSPACE-complete，指数空间完全问题，即所需计算资源随问题规模指数级增长）。作者为Pascal Bergsträßer、Ryan Cotterell和Anthony Widjaja Lin。第二篇LLMs Get Lost In Multi-Turn Conversation聚焦大语言模型在实际部署中的短板：训练主要基于单轮文本补全，而真实场景多为多轮对话。研究发现，当用户指令不充分时，所有被测试模型在多轮交互中性能平均下降39%，且模型容易在对话早期过早做出错误假设并难以纠正。作者为Philippe Laban、Hiroaki Hayashi、Yingbo Zhou和Jennifer Neville。

本届会议还颁发了“时间检验奖”（Test of Time Award），表彰ICLR 2016上发表的两篇经久不衰的经典工作。第一篇是Alec Radford、Luke Metz和Soumith Chintala合著的 Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks （常称DCGAN），它最早成功展示了基于学习的生成模型能合成多样且逼真的复杂图像，为当今活跃的图像生成领域（虽然后来技术从生成对抗网络GAN转向扩散模型）奠定了关键基石。第二篇是Timothy P. Lillicrap、Jonathan J. Hunt、Alexander Pritzel、Nicolas Heess、Tom Erez、Yuval Tassa、David Silver和Daan Wierstra合著的 Continuous control with deep reinforcement learning ，该论文提出的深度确定性策略梯度（DDPG，一种能处理连续动作空间的深度强化学习算法）首次将神经网络与确定性Actor-Critic架构结合，使智能体能从原始传感器数据直接学习精确的连续物理动作，彻底改变了物理系统控制的研究轨迹，并引发了强化学习在该领域的革命。

#疾病与健康 #神经机制与脑功能解析 #阿尔茨海默病 #触觉感知 #Tau蛋白

阅读更多：

https://blog.iclr.cc/2026/04/22/announcing-the-test-of-time-awards-from-iclr-2016/

美国批准首个基因疗法，有望治愈罕见遗传性耳聋

美国卫生官员近日批准了首个用于治疗罕见遗传性听力损失的基因疗法，为听力障碍治疗领域带来重大突破。该疗法名为Otarmeni，由美国生物技术公司Regeneron（再生元）开发，针对因OTOF基因突变导致的听力损失。OTOF基因负责编码一种关键蛋白质，该蛋白质对于将听觉信号从内耳传递至大脑至关重要。在美国，每年约有50名新生儿受此罕见病症影响。临床试验评估了20名年龄在10个月至16岁之间的儿科患者，结果显示至少80%的患者在数月后听力得到显著改善。参与试验的医生、波士顿儿童医院的耳鼻喉科专家Eliot Shearer表示，FDA的加速批准“标志着遗传性听力损失治疗进入了一个新时代”。

该疗法通过外科医生单次耳内注射完成，已被部分患儿家长誉为革命性突破。一位名叫Sierra Smith的母亲激动地分享，她的儿子Travis在接受治疗后，从听不到自己的名字到如今能够欣赏音乐、热爱跳舞和乐器。尽管基因疗法通常极其昂贵，在美国每名患者的费用可能高达数百万美元，但Regeneron公司表示，将向符合条件的美国患者免费提供此疗法。这一举措无疑为受影响的家庭带来了希望。随着此次批准，该疗法将适用于因OTOF基因特定突变导致重度至极重度听力损失的儿童和成人，为未来其他遗传性听力损伤的治疗铺平了道路。

#基因疗法 #听力损失 #OTOF基因 #Regeneron #FDA批准

阅读更多：

https://www.fda.gov/news-events/press-announcements/fda-approves-first-ever-gene-therapy-treatment-genetic-hearing-loss-under-national-priority-voucher

年收入首超OpenAI！Anthropic获谷歌400亿美元天价投资

人工智能公司Anthropic近日证实，科技巨头谷歌已承诺向其投资最高达400亿美元。根据协议，谷歌将先期投入100亿美元，剩余300亿美元将取决于Anthropic能否达成特定的业绩里程碑。这项投资建立在双方的深度合作基础上，Anthropic将使用定制的谷歌芯片和云计算服务来驱动其人工智能技术。就在几天前，亚马逊也宣布了类似的加码计划，拟向Anthropic追加投资50亿美元，并可能在未来根据业绩目标再投200亿美元。作为回应，Anthropic承诺未来十年将在亚马逊网络服务技术上投入超过1000亿美元，以支撑其AI发展。

在巨额资本加持下，Anthropic的财务表现显著提升。该公司4月初披露，其年化收入环比增长了两倍，首次突破300亿美元大关，超越了竞争对手OpenAI。与此同时，公司也面临着安全与监管的复杂局面。其首席执行官Dario Amodei近期访问了白宫，双方就公司拒绝无条件向军方开放AI模型一事进行了友好沟通。此外，Anthropic发布了最新AI模型Mythos，但因担忧其被用于网络攻击等潜在的网络安全风险，并未向公众开放，仅限40家主要科技公司提前使用以修复漏洞。然而，公司本周表示正在调查对Mythos的未授权访问事件，这款强大模型的安全性正受到密切关注。

#谷歌投资 #Anthropic #AI竞赛 #AWS合作 #Mythos模型

阅读更多：

https://www.bloomberg.com/news/articles/2026-04-24/google-plans-to-invest-up-to-40-billion-in-anthropic

AI 驱动科学

Nature：评估标准导致AI“胡说八道”

大语言模型的幻觉问题极大限制了其可靠性。OpenAI的Adam Tauman Kalai等发现，基于准确性的现行评估标准在系统性地鼓励模型盲目猜测，这是加剧虚假信息产生的根源。

研究团队从两方面剖析了模型出错的原因。在预训练阶段，基于下一个词预测（next-word prediction，模型根据上下文推测下一个词汇的训练机制）的统计压力使AI极易记错罕见事实。在评估阶段，主流基准测试的二元评分系统（答对得1分，答错或放弃得0分）本质上奖励了毫无根据的猜测。为解决该难题，团队提出开放式评分标准（open-rubric，在提示词中明确告知答错扣分等惩罚规则的新型评估方法）。在对四个前沿大模型（Gemini 3 Pro、GPT-5、Grok 4和Claude Opus 4.5）的测试中发现，明确告知答错会受到惩罚后，所有模型均能动态调整其猜测倾向。惩罚越重，模型越倾向于放弃回答。这证明优化评估机制能有效引导AI在不确定时保持谨慎，从而显著提升可靠性。研究发表在 Nature 上。

#大模型技术 #大模型技术 #模型评估 #幻觉机制 #人工智能

阅读更多：

Kalai, Adam Tauman, et al. “Evaluating Large Language Models for Accuracy Incentivizes Hallucinations.” Nature, Apr. 2026, pp. 1–3. www.nature.com, https://doi.org/10.1038/s41586-026-10549-w

新型人工视网膜不仅恢复视力，还能赋予近红外视觉

视网膜变性会导致感光细胞退化进而引发失明，如何恢复患者视力并拓展视觉感知成为了该领域的重大挑战。Won Gi Chung、Inhea Jeong等研究人员（韩国延世大学、基础科学研究院等）开发出一种柔性植入式人工视网膜，该成果不仅能部分恢复盲鼠丧失的视力，还史无前例地赋予了它们感知近红外光的能力。

▷ 近红外感知人工视网膜示意图，包含近红外透射滤波器和光电晶体管阵列。Credit: Nature Electronics (2026).

研究团队设计了一种贴附在视网膜前表面的超薄设备。其底层包含一个近红外透射滤波器（NIR-transmission filter，一种能够阻挡可见光并精准筛选近红外光的薄膜组件）以及一个光电晶体管阵列（phototransistor array，能探测近红外光信号并将其转换为电信号的微型光敏网格）。为了将电信号无损传递给视网膜神经节细胞，团队采用了液态金属微柱电极（liquid metal micropillar electrodes，由柔软且导电的液态金属制成的三维微型柱状结构）。该材料具有极低的杨氏模量（Young's modulus，衡量固体材料抗形变能力或柔软度的物理力学指标），不仅能紧密贴附于不规则的视网膜表面以实现高效电荷注入，还能最大程度减少对眼部组织的硬性损伤。离体实验证实了该设备的出色生物相容性。在活体实验中，研究人员将设备成功植入健康小鼠和患有视网膜退行性疾病的盲鼠眼内。大脑皮层活动记录和行为学测试的结果清晰显示，小鼠成功感知到了原本不可见的近红外光。这一重大发现表明，该植入设备不仅有望为失明患者重塑视觉，更能建立感知红外辐射的全新感知途径。研究发表在 Nature Electronics 上。

#疾病与健康 #脑机接口 #视网膜变性 #人工视网膜 #近红外视觉

阅读更多：

Chung, Won Gi, et al. “An Implantable Epiretinal Device for Near-Infrared Light Perception.” Nature Electronics, Apr. 2026, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41928-026-01601-8

利用端到端AI框架实现RNA翻译可编程控制

精准控制蛋白质表达是基因疗法研发的重大难题。Le Cong和Mengdi Wang团队（斯坦福大学与普林斯顿大学）构建了一个端到端的人工智能框架，成功实现了核酸翻译元件的精准识别、进化优化与从头生成，为下一代分子疗法扩充了核心工具包。

研究团队开发了包含三个核心组件的深度学习框架。首先，识别系统结合了擅长非翻译区分析的语言模型和非编码核糖核酸分析模型，在四万多个标记序列上进行训练。该系统在线性信使核糖核酸内部核糖体进入位点（IRES，一段能绕过传统机制直接启动翻译的特殊RNA序列）的识别上，较现有最佳方法提升了百分之十五的准确度，并能完全识别已验证的环状RNA功能片段。其次，进化算法系统通过定向突变诱导序列功能，在三万多个非功能序列的计算评估中，百分之六十被成功转化为预测的功能序列。大规模并行报告实验验证了一万两千个突变序列，其中百分之九十八点四获得了可检测的翻译启动功能。最后，团队使用扩散模型无需模板从头生成全新序列。实验证实该系统生成的一万两千个新序列中百分之九十九点三具备实质功能活性。该平台发掘出诸多自然界罕见的高活性序列模式。研究发表在 Nature Machine Intelligence 上。

#AI驱动科学 #大模型技术 #RNA疗法 #合成生物学 #内部核糖体进入位点

阅读更多：

Chu, Yanyi, et al. “Programmable RNA Translation through Deep Learning-Driven IRES Discovery and de Novo Generation.” Nature Machine Intelligence, vol. 8, no. 4, Apr. 2026, pp. 559–74. www.nature.com, https://doi.org/10.1038/s42256-026-01213-z

trRosettaRNA2，精准预测RNA三维结构与动态构象

RNA分子的三维结构解析因其高度灵活性和实验数据稀缺性，山东大学杨建益教授团队（王文恺博士为论文第一作者）成功开发出全新的深度学习算法trRosettaRNA2，突破了数据的限制，不仅实现了高精度的RNA静态三维结构预测，还能精准捕捉其复杂的动态构象。

该研究创新性地采用以二维蓝图指导三维施工的计算策略。由于真实的RNA三维结构数据非常有限，研究人员利用海量且易获取的RNA二级结构数据，训练出独立的预训练先验模块trRNA2-SS。在进行最终预测时，模型引入了二级结构感知注意力（SS-aware attention，一种使神经网络能够动态且有侧重地参考二维蓝图特征来推演三维空间坐标的深度学习机制），结合一维序列生成最终的三维坐标以及构象异构体（conformers，指同一分子因内在物理灵活性而产生的不同三维空间排列状态）。数据表明，trRosettaRNA2在TS28测试集上的预测精度较前代模型大幅提升了百分之二十四，物理合理性表现优于AlphaFold3。同时，该模型的参数量仅为约3000万，显著降低了计算成本。在严苛的CASP16国际盲测中，基于该算法的服务器成功夺得自动化组别冠军。此外，该模型无需借助任何实验数据，便成功推演出核糖核酸酶P的多种动态构象。研究发表在 Nature Machine Intelligence 上。

#AI驱动科学 #预测模型构建 #RNA三维结构 #计算结构生物学

阅读更多：

Wang, Wenkai, et al. “Predicting RNA 3D Structure and Conformers Using a Pre-Trained Secondary Structure Model and Structure-Aware Attention.” Nature Machine Intelligence, Apr. 2026, pp. 1–13. www.nature.com, https://doi.org/10.1038/s42256-026-01223-x

智能超材料纺织品实现无电池连续血压监测

目前可穿戴健康设备面临频繁充电和电池笨重的问题，如何实现连续无感监测？Selman A. Kurt和Kevin Albert Kasper及其团队（新加坡国立大学、亚利桑那大学和清华大学）开发了一种新型无电池表皮传感系统，成功通过超材料衣物实现了运动状态下的连续血压监测。

▷ 双模超材料纺织品的照片展示了整体设计、腕部终端上的无线供电表皮传感器以及用于无线供电和收集生理信号的智能手机。Credit: Kurt et al.

该系统由直接贴附在皮肤上的超薄表皮传感器（epidermal sensors，一种轻薄柔韧且能采集特定生理信号的装置）组成，完全抛弃了传统的集成电池。研究人员创新性地设计出一种双模超材料纺织品（dual-mode metamaterial textile，一种经过特殊结构设计可引导电磁能量传输的面料），并将其无缝集成到日常衣物中。这种超材料巧妙地将功率传输通道（13.56 MHz）和数据通信通道（2.4 GHz）隔离开来，有效避免了无线充电与数据采集之间的信号干扰。在实际运行中，用户的智能手机充当系统枢纽，通过衣物上的超材料网络向传感器隔空输送能量，同时实时接收生理数据。性能评估结果显示，无论用户处于静息状态还是在进行剧烈运动，该网络都能以高保真度准确测量收缩压。这一无源设计彻底打破了以往健康追踪器的数据传输与续航瓶颈，为未来个性化医疗服装的普及奠定了基础。研究发表在 Nature Electronics 上。

#疾病与健康 #健康管理与寿命延长 #无电池可穿戴设备 #超材料纺织品 #连续血压监测

阅读更多：

Kurt, Selman A., et al. “A Battery-Free Wireless Epidermal Sensor Network for Continuous Systolic Blood Pressure Monitoring.” Nature Electronics, Apr. 2026, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41928-026-01597-1

为什么更快的AI并不总是更好：延迟反而提升用户感知质量

大语言模型响应越快，用户体验就越好吗？纽约大学坦登工程学院的Felicia Fang-Yi Tan、Moritz Alexander Messerschmidt、Wen Yin和Oded Nov团队通过实验打破了这一传统认知，发现人为引入的响应延迟反而能提升用户对AI回答的质量感知。

研究团队招募了240名参与者，通过定制界面进行了一项受控实验。参与者被分配执行创造类或建议类任务，并在接收回复前经历不同的系统响应时间（System Response Times，即系统从接收指令到首次输出结果的等待期，本实验设置为2秒、9秒或20秒）。系统日志显示，用户的实际交互行为不受响应速度影响，但在不同任务间差异显著，例如创造类任务促使参与者提交更多轮次的提示。然而在质量感知上，经历2秒延迟的参与者对大语言模型的评价普遍较低，认为其回答缺乏思考。相反，经历9秒或20秒延迟的参与者对完全相同的回答评价更高，将其视为AI深思熟虑的体现。这种现象与正向摩擦的心理效应密切相关。该发现表明延迟本身可作为一种重要的交互设计变量，同时也引发了有关AI是否应通过人为操控等待时间来获取用户信任的伦理反思。研究发表在 Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems 上。

#认知科学 #大模型技术 #人机交互 #正向摩擦 #用户感知

阅读更多：

Tan, Felicia Fang-Yi, et al. “The Impact of Response Latency and Task Type on Human-LLM Interaction and Perception.” Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems [New York, NY, USA], CHI ’26, 2026, pp. 1–17. ACM Digital Library, https://doi.org/10.1145/3772318.3790716

Google DeepMind推出通用视觉基础模型Vision Banana

生成模型是否能深入理解视觉内容长期未有定论。Valentin Gabeur、Shangbang Long和Songyou Peng等（谷歌DeepMind）推出通用视觉模型Vision Banana。该模型不仅保留了原本的图像生成能力，还在二维与三维视觉理解测试中超越了多款专用模型。研究采用了指令微调的方法，将图像生成模型Nano Banana Pro作为底层平台。

其核心创新在于将不同视觉任务的输出统一重构成 RGB 图像。例如在单目度量深度估计（metric depth estimation 仅根据单张图像预测每个像素点到摄像头物理距离的任务）中，团队设计了可逆的数值映射机制，将物理深度值编码为对应的彩色像素。训练时仅需在海量原有数据中混入极低比例的视觉理解数据。测试结果显示，该模型不仅在零样本条件下展现出强大泛化性，其在城市景观语义分割任务中的交并比达到0.699，还在多项深度测试中平均精度高达0.929，均优于传统领域的专业模型。此外在生成能力评测中，该模型与原模型的胜负率基本持平，证明轻量级微调有效兼顾了理解与生成。

#大模型技术 #其他 #计算机视觉 #图像生成 #指令微调

阅读更多：

Gabeur, Valentin, et al. “Image Generators Are Generalist Vision Learners.” arXiv:2604.20329, arXiv, 22 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.20329

苹果新研究揭示大模型隐私隐患：你的Logits知道些什么？

视觉语言模型在回答简单问题时是否彻底过滤了无关的隐私信息？Masha Fedzechkina、Eleonora Gualdoni、Rita Ramos与Sinead Williamson（苹果公司）探究了模型信息压缩过程，发现模型输出的表层候选词概率数据中残留大量未提及的敏感细节，揭示了潜在的严重隐私安全隐患。

该研究基于信息瓶颈原则（Information Bottleneck Principle，即模型应在决策时保留关键指标并过滤无效干扰），对视觉语言模型进行测试。团队使用探针监测模型内部数据，并在图像数据集中施加高斯噪声。对比残差流与最终的对数几率后，研究揭示了严重的安全隐患。底层状态保留了图像全部细节，而最终输出层虽经过压缩，但排名前列的候选词得分依然会泄露隐私。实验表明，仅截取前三十到八十个表层候选项，探针就能以极高准确率预测出提示词中未提及的目标材质及背景物体特征。这证实获取表层数据的隐私泄露风险与获取深层数据的风险几乎完全相当。

#大模型技术 #计算模型与人工智能模拟 #视觉语言模型 #隐私泄露 #信息瓶颈原则

阅读更多：

Fedzechkina, Masha, et al. “What Do Your Logits Know? (The Answer May Surprise You!).” arXiv:2604.09885, arXiv, 10 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.09885

深度学习的牛顿定律：14名顶尖学者提出学习力学统一理论框架

深度学习长期以来高度依赖工程直觉与实验试错，缺乏解释其内部机制的基础科学理论。加州大学伯克利分校、哈佛大学和斯坦福大学的Jamie Simon、Daniel Kunin和Alexander Atanasov等十四名研究人员梳理了现有的理论碎片，提出了一种名为学习力学（Learning Mechanics，旨在为神经网络学习过程建立第一性原理的科学框架）的全新基础理论体系。

研究团队系统梳理了过去十年的理论成果，提炼出构建学习力学的五大核心线索。首先是可解的理想化设定，如深度线性网络（Deep Linear Networks，将激活函数替换为恒等映射的简化神经网络）和神经正切核（Neural Tangent Kernel，描述无限宽网络在训练中行为的固定核函数），它们提供了基础且可精确求解的理论模型。其次是可处理的极限分析，探讨网络趋于无限宽时的行为演变，例如参数几乎不改变的惰性训练状态与特征发生实质改变的丰富状态。第三是跨越模型架构的经验定律，如神经缩放律（Neural Scaling Laws，模型测试损失随计算量增加呈现幂律衰减的普遍规律）。第四是超参数理论，例如最大更新参数化（Maximal Update Parameterization，通过特定缩放规则实现超参数在不同规模模型间直接迁移的方案）。最后是表征收敛现象，即不同网络最终会学到高度相似的内部特征。研究结果不仅搭建了理论图景，还梳理出非线性动力学解析等十项关键难题。

#大模型技术 #其他 #深度学习理论 #学习力学

阅读更多：

Simon, Jamie, et al. “There Will Be a Scientific Theory of Deep Learning.” arXiv:2604.21691, arXiv, 23 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.21691

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问，我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。

研究院还建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。