打开网易新闻 查看精彩图片

脑科学动态

Science:新型短RNA分子可逆转TDP-43蛋白聚集,有望攻克渐冻症

大脑如何决定记忆的关联与分离

脑控听觉系统:嘈杂环境中的实时语音增强技术

大脑组胺系统如何影响我们的情绪与精神健康

咖啡因增强大脑抑制反应以优化触觉处理

看淡损失让你更坚强:脑扫描揭示心理韧性的神经基础

AI行业动态

OpenAI豪掷40亿美元成立部署公司,并推出AI网络防御利器Daybreak

AI驱动科学

Science:人工智能在急诊室真实病例诊断中击败人类医生

人类难以准确回忆AI生成内容:混合人机协作极易引发记忆混淆

AI生成的抑郁症图像被指加剧刻板印象与污名化

新闻找上门还是偏见找上门?

混合AI架构打造可靠的“发现机器”

新型量子点发射器实现电信波段高相干光子高效发射

当AI设计蛋白质时,我们如何确保它没有恶意?

语言模型在处理医院结构化数据方面表现不佳

脑科学动态

Science:新型短RNA分子可逆转TDP-43蛋白聚集,有望攻克渐冻症

肌萎缩侧索硬化症等神经退行性疾病中,TDP-43蛋白异常聚集导致神经元死亡,目前缺乏有效疗法。Katie E. Copley、James Shorter及团队成员(美国宾夕法尼亚大学佩雷尔曼医学院)发现了一类具有伴侣功能的短RNA分子,能够有效阻止并逆转TDP-43的病理性聚集,并在小鼠模型中展现出显著的神经保护与修复作用。

研究团队重点解析了Clip34和Malat1_start等短RNA分子的作用机制。体外实验显示,这些短RNA特异性结合TDP-43的RNA识别基序,通过变构作用削弱其朊病毒样结构域(prion-like domain,蛋白质中极易发生异常折叠并引发同类蛋白聚集的特殊区域)的螺旋结构,从而促使蛋白质形成抗聚集的稳定构象。这种结合机制对野生型蛋白有效,且能克服多种疾病相关突变带来的影响。在细胞实验中,Malat1_start成功将巨大的致病聚集物重塑为安全的小型结构。在提取自患者的诱导多能干细胞衍生运动神经元中,这些短RNA成功促使致病蛋白重新返回细胞核,并恢复了依赖该蛋白的基因剪接功能。最终在小鼠脊髓病理模型中,治疗组的细胞质内蛋白质聚集显著减少,运动神经元大量存活。该成果为针对严重神经系统疾病的核酸药物开发提供了全新理论基础。研究发表在 Science 上。

#疾病与健康 #神经机制与脑功能解析 #肌萎缩侧索硬化症 #RNA疗法 #TDP-43

阅读更多:

Copley, Katie E., et al. “Short RNA Chaperones Promote Aggregation-Resistant TDP-43 Conformers to Mitigate Neurodegeneration.” Science, vol. 392, no. 6798, May 2026, p. eadv3301. science.org (Atypon), https://doi.org/10.1126/science.adv3301

大脑如何决定记忆的关联与分离:前额叶皮层在防止错误记忆链接中的关键作用

大脑如何区分并组织相关的与无关的记忆,以防止产生像精神分裂症患者那样的错误记忆关联?加州大学洛杉矶分校脑研究所(University of California, Los Angeles)的André F. de Sousa及其团队发现,前额叶皮层在决定记忆是否相互关联中发挥着关键的调控作用,揭示了大脑防止错误记忆整合并引导认知行为的特定神经通路。

打开网易新闻 查看精彩图片

海马体中编码两种不同记忆的神经元。蓝色:DAPI,红色:mCherry(TRAP2),绿色:c-Fos(免疫组织化学)。Credits: André F. de Sousa.

研究团队通过小鼠行为学实验揭示了该过程。小鼠被安排探索不同时间间隔或不同相似度的环境,研究人员利用微型显微镜)监测其腹内侧前额叶皮层(vmPFC)的钙离子活动。结果显示,当小鼠间隔7天探索完全不同的环境时,vmPFC的活动显著增强以促进记忆分离。团队随后利用化学遗传学在小鼠探索新环境时抑制vmPFC。结果显示这些小鼠错误地将间隔7天的无关记忆整合在一起,在环境B受电击后,于安全的同类环境A中也表现出恐惧冻结反应。神经追踪表明,vmPFC通过直接投射到内侧内嗅皮层(MEC),调控背侧海马CA1区的神经胶质样细胞,从而精确选择哪些海马神经元来编码新记忆,防止不同事件被错误关联。研究发表在 Nature Neuroscience 上。

#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #前额叶皮层 #记忆链接

阅读更多:

de Sousa, André F., et al. “The Prefrontal Cortex Controls Memory Organization in the Hippocampus.” Nature Neuroscience, vol. 29, no. 5, May 2026, pp. 1191–202. www.nature.com, https://doi.org/10.1038/s41593-026-02231-1

脑控听觉系统:嘈杂环境中的实时语音增强技术

嘈杂环境中的目标语音识别是听觉辅助技术面临的核心难题。哥伦比亚大学的Vishal Choudhari和Nima Mesgarani团队开发了一种实时的闭环脑控听觉系统,该系统能根据用户的神经信号动态增强其关注的对话,显著改善了多说话者环境中的语音感知体验。

打开网易新闻 查看精彩图片

这套听觉系统通过监测该男子的脑电活动,根据他脑电波显示他正在关注的对话,放大左侧播放的对话,同时降低右侧播放的对话音量。Credit: Vishal Choudhari / Mesgarani lab / Columbia's Zuckerman Institute

这项研究招募了四名植入颅内电极的患者。研究人员利用颅内脑电图监测受试者聆听重叠对话时的脑信号。系统通过线性回归模型,利用高伽马和低频神经特征重建受试者关注语音的时间包络(temporal envelope,声波振幅随时间变化的轮廓特征)。随后,系统比对重建结果与环境语音,识别受试者的注意力焦点,并实时动态提升目标语音的音量。结果表明,该系统能准确跟踪注意力,显著提高了目标语音的清晰度。同时,受试者的瞳孔扩张幅度下降,证明听觉认知负荷有效降低。受试者也一致偏好开启该系统的聆听体验。这为未来的个性化听觉辅助设备奠定了基础。研究发表在 Nature Neuroscience 上。

#意识与脑机接口 #脑机接口 #听觉增强 #听力损失 #鸡尾酒会效应

阅读更多:

Choudhari, Vishal, et al. “Real-Time Brain-Controlled Selective Hearing Enhances Speech Perception in Multi-Talker Environments.” Nature Neuroscience, May 2026, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41593-026-02281-5

大脑组胺系统如何影响我们的情绪与精神健康

组胺作为神经递质在人脑功能和精神健康中的具体作用长期未得到充分解析。伦敦国王学院和波尔图大学的Daniel Martins、Mattia Veronese、Daniel van Wamelen、Ling Shan、Oliver Howes、Adam Hampshire、Federico Turkheimer和Steven CR Williams构建了首个人脑多尺度组胺图谱,揭示了组胺系统与大脑认知过程以及多种精神性疾病之间的深刻关联。

打开网易新闻 查看精彩图片

红色区域表示大脑中组胺相关基因表达较多的区域,蓝色区域则相对较少。这些基因(HDC、HNMT、ALDH7A1、MAOB、HRH1、HRH2、HRH3、HRH4)在组胺信号传导中发挥着多种作用,包括组胺生成(HDC)、组胺分解(HNMT)以及编码组胺受体(HRH1、HRH2、HRH3、HRH4)。Credit: Nature Mental Health (2026).

该研究整合了转录组学和单细胞RNA测序数据,并结合正电子发射断层扫描(PET)进行了系统分析。结果显示,各类组胺受体在神经元中的分布具有高度特异性,其中HRH1和HRH2主要存在于兴奋性神经元,而HRH3优先在抑制性神经元中表达。这一发现表明组胺在维持神经系统兴奋与抑制的健康平衡中发挥着核心作用。在脑区分布上,组胺基因在额叶和边缘系统中表达尤为活跃。通过与认知及临床数据库比对,研究人员发现这些高表达脑区不仅主导情绪调节、压力响应和睡眠周期,还与重度抑郁症、精神分裂症和注意力缺陷多动障碍患者大脑中发生结构改变的脆弱区域高度重叠。该成果为开发直接靶向组胺系统的精神疾病创新疗法提供了重要依据。研究发表在 Nature Mental Health 上。

#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #神经递质 #神经影像学

阅读更多:

Martins, Daniel, et al. “Mapping Histamine Pathway Networks in the Human Brain across Cognition and Psychiatric Disorders.” Nature Mental Health, May 2026, pp. 1–13. www.nature.com, https://doi.org/10.1038/s44220-026-00637-1

咖啡因增强大脑抑制反应以优化触觉处理

典型剂量的咖啡因是如何影响大脑将触觉信号与肌肉反应联系起来的底层机制的?Camilla Carrozzo、Martina Cannazza等(丹麦奥胡斯大学医院等)通过研究发现,咖啡因能显著增强大脑过滤外来触觉刺激并抑制过度肌肉反应的能力,从而帮助平稳控制动作。

研究招募了20名健康成年人开展随机双盲交叉试验。参与者分别咀嚼含有200毫克咖啡因的口香糖或安慰剂口香糖。研究人员采用经颅磁刺激作用于受试者大脑的运动皮层,并使用两种技术测量短潜伏期传入抑制。第一种是使用固定磁脉冲测量肌肉抽搐幅度的常规振幅法,第二种是自动调节脉冲强度以维持恒定肌肉反应的阈值追踪法。结果显示,常规振幅法评估表明,咖啡因在刺激后19至21毫秒期间,显著增强了大脑抑制肌肉反应的能力;而阈值追踪法则未检测到这种变化。团队认为,咖啡因可能阻断了腺苷受体,从而增加了乙酰胆碱水平。这为理解脑部疾病的病理生理学提供了新视角。研究发表在 Clinical Neurophysiology 上。

#疾病与健康 #神经机制与脑功能解析 #咖啡因 #神经调控 #感觉运动整合

阅读更多:

Carrozzo, Camilla, et al. “The Effects of Caffeine on Short-Latency Afferent Inhibition Measured with Paired-Pulse Conventional and Threshold-Tracking TMS.” Clinical Neurophysiology, vol. 187, July 2026, p. 2111857. ScienceDirect, https://doi.org/10.1016/j.clinph.2026.2111857

看淡损失让你更坚强:脑扫描揭示心理韧性的神经基础

在权衡利弊时对损失的低估如何影响抗压能力?凯泽斯劳滕-兰道大学和阿姆斯特丹大学的Ulrike Basten等研究人员探索了决策偏差与心理韧性的关联。结果表明,不看重损失的人心理韧性更强,这得益于前额叶脑区对负面信息的强大神经调节。

这项研究招募了82名参与者进行成本-效益整合任务,通过呈现与金钱得失相关的颜色和形状图片观察其决策过程。研究人员运用功能性磁共振成像和认知计算建模分析了大脑活动。结果显示,部分参与者对小额损失赋予的价值较低,因而更倾向于接受好坏参半的提议。这种积极的选择偏差与更高水平的特质接受度密切相关。脑部扫描进一步揭示,这些不太看重损失的人在遭受负面信息时,前额叶和顶叶的十个脑区活动显著增强;而在获得正面信息时,右下额叶交界处的活动明显减弱。这表明,与认知控制相关的前额叶脑区对负面信息的强烈反应,能帮助个体更好地调节对损失的主观感受,从而在面对压力时展现更强的心理韧性。研究发表在 Journal of Neuroscience 上。

#神经科学 #意图与决策 #心理健康与精神疾病 #fMRI #心理韧性

阅读更多:

Rammensee, Rebecca A., et al. “Positive Bias in Value-Based Decision Making: Neurocognitive Associations With Resilience.” Journal of Neuroscience, May 2026. Research Articles. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.1734-25.2026

AI 行业动态

OpenAI豪掷40亿美元成立部署公司,并推出AI网络防御利器Daybreak

人工智能领域的领军者OpenAI近日宣布了两项重大战略举措,标志着其从单纯的模型提供商向深度介入企业业务流程的关键转型。首先,OpenAI成立了由其控股的“OpenAI部署公司”(OpenAI Deployment Company),并获得了超过40亿美元的初始投资。该公司汇集了19家领先投资机构、咨询公司及系统集成商,旨在帮助企业将前沿AI技术真正应用于生产环境,直接赋能销售、法务、客户支持、软件开发乃至供应链管理等核心业务操作。为实现这一目标,OpenAI同时收购了英国应用型AI咨询与工程公司Tomoro,将约150名前沿部署工程师(Forward Deployed Engineer,简称FDE,指深入企业内部、协助解决实际问题的专业工程师)纳入麾下。这一模式被外界类比于大数据公司Palantir的成功路径——通过深度嵌入客户组织,围绕数据和决策构建集成系统,而OpenAI希望成为AI经济中的“部署层”。

与此同时,OpenAI还推出了名为“Daybreak”的网络安全AI工具,旨在彻底改变软件的构建与防护方式。Daybreak整合了OpenAI最强大的模型、Codex及其安全合作伙伴网络,能够帮助防御者更早地发现并修复漏洞、自动化安全检测与响应,甚至让软件从设计之初就具备内在的韧性。OpenAI首席执行官Sam Altman强调,此举旨在加速网络防御,并使安全团队能够以前所未有的速度行动。综合来看,通过成立部署公司以深入企业运营,并推出Daybreak以筑牢数字防线,OpenAI正从技术源头走向应用前线,致力于成为企业智能化转型中不可或缺的基础设施与战略伙伴。

#OpenAI #企业AI部署 #Daybreak网络安全 #前沿部署工程师 #AI转型

阅读更多:

https://openai.com/index/openai-launches-the-deployment-company/

AI 驱动科学

Science:人工智能在急诊室真实病例诊断中击败人类医生

大型语言模型在真实临床环境中的诊断能力究竟如何?Peter G. Brodeur和Adam Rodman等(波士顿贝斯以色列女执事医疗中心等)评估了人工智能在急诊科真实病例中的表现,证实其在复杂诊断推理中超越了人类医生基准。

研究团队开展五项实验评估OpenAI的o1系列模型,与数百名人类医生的表现进行横向对比。此外,研究在波士顿一家医院的急诊科开展了真实世界双盲测试,随机抽取76名患者的病历。在分诊、急诊医生接诊和入院三个阶段,让人工智能与两名主治医生进行同台对比。结果显示,在信息最匮乏且不确定性最高的分诊阶段,o1模型在67%的病例中给出了正确的鉴别诊断,而两名人类医生的准确率分别为50%和55%。在临床推理记录评分中,o1模型在绝大多数测试中获得满分,显著优于主治医生和住院医生。由于人工智能目前仅依赖文本进行判断,尚未参与现实急诊科的复杂医患交互,未来亟须开展前瞻性临床试验。研究发表在 Science 上。

#疾病与健康 #大模型技术 #急诊医学 #临床推理

阅读更多:

“Performance of a Large Language Model on the Reasoning Tasks of a Physician.” Science. www.science.org, https://www.science.org/doi/10.1126/science.adz4433. Accessed 12 May 2026

人类难以准确回忆AI生成内容:混合人机协作极易引发记忆混淆

针对人们在使用人工智能辅助创作后能否准确回忆内容来源的问题,Tim Zindulka和Daniel Buschek等人(拜罗伊特大学与阿尔托大学)发现,仅仅一周后,用户就会对哪些内容是自己原创、哪些由人工智能生成产生严重的记忆混淆。这一结果凸显了人机共创中记忆偏差的严重性。

研究团队招募了184名参与者进行了一项对照实验。参与者需要在无辅助或基于大语言模型的聊天机器人辅助下,完成构思想法并撰写单句阐述的任务。一周后,研究人员对参与者进行测试,要求他们辨认之前构思和文本的来源,并引入未见过的干扰项来验证记忆的可靠性。

实验显示,引入人工智能会显著削弱用户的来源记忆(source memory,个体对获取信息具体背景和来源的记忆),尤其是混合工作流的错误率最高。当想法由人工智能生成但由人类进行文字表述时,正确回忆该想法由人工智能生成的概率降至37.7%;反之,若人类构思由人工智能润色,正确识别原创想法的概率仅为64%。此外,参与者普遍存在过度自信,其对自己记忆准确率的评估分别在想法和阐述层面高估了12%和6%。这一发现在即将出台人工智能内容标注法规的背景下,为交互式文本生成技术的设计提供了重要参考。研究发表在 Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems 上。

#认知科学 #大模型技术 #人机交互 #记忆混淆 #人工智能监管

阅读更多:

https://dl.acm.org/doi/10.1145/3772318.3791494

AI生成的抑郁症图像被指加剧刻板印象与污名化

AI生成的图像是否会加剧心理健康的污名化?Nuria Saladie、Carolina Llorente、Renée Joosten和Gema Revuelta(庞培法布拉大学)的研究发现,AI生成的抑郁症图像比传统媒体图像包含更多刻板印象,对患者负面影响更深,提示需谨慎审视AI的视觉输出。

该研究采用混合研究方法,通过焦点小组讨论与准实验性在线问卷调查,收集了792名抑郁症患者和年轻受访者的数据,旨在对比这两类人群对大众媒体图像与AI生成图像的认知差异。研究结果显示,尽管媒体和AI图像都存在认知偏差,但受访者普遍认为AI生成的图像往往描绘人物孤身处于阴影中且面部被遮挡,呈现出更深层的污名化,并极易对抑郁症患者造成负面心理冲击。相比之下,大众媒体的图像被认为更为真实和包容。此外,数据表明,当受访者被明确告知图像是由AI生成时,他们对其表现出显著的批判态度与排斥倾向(P<.001)。这证实了受众对AI工具应用的透明度具有极高的敏感性。研究认为,AI工具在生成图像时并非客观中立,为了负责任地进行精神健康传播,必须加强患者协会、AI开发者和新闻工作者等多方团队的合作。研究发表在 JMIR Human Factors 上。

#疾病与健康 #心理健康与精神疾病 #跨学科整合 #生成式人工智能 #污名化

阅读更多:

Saladie, Nuria, et al. “Comparing Images of Depression in Mass Media and AI-Generated Pictures: Mixed Methods Study.” JMIR Human Factors, vol. 13, no. 1, Apr. 2026, p. e81230. humanfactors.jmir.org, https://doi.org/10.2196/81230

新闻找上门还是偏见找上门?三分之一受众认为算法推荐与专业新闻同等可靠

越来越多受众放弃主动获取新闻,转而依赖算法和社交网络推送,这种新闻会主动找上门的心态引发了虚假信息传播风险。Mengqi Liao、Yuan Sun、Homero Gil De Zúñiga和S. Shyam Sundar等(佐治亚大学、宾夕法尼亚州立大学等)通过实验证实,此类人群会将算法和网络好友视为与专业新闻编辑同样可靠的新闻来源。

该研究团队开展了一项包含244名参与者的在线随机对照实验。参与者首先通过标准化量表测试其新闻会主动找上门(NFM,News Finds Me)的心态水平,随后被随机分配到三个模拟的新闻推送环境中。这三个环境展示的新闻内容完全一致,唯一的变量是推荐来源:专业新闻编辑、社交媒体好友或算法。结果表明,中低NFM水平的个体对信息来源具有更强的批判性,更看重专业记者的报道;而高NFM水平的用户则认为算法和好友分享的新闻与专业编辑推荐的一样可信。研究揭示了其背后的心理机制:不同的新闻来源会触发受众不同的认知启发式。高NFM人群因为触发了机器启发式而高度信任算法,此外,他们还将算法和好友赋予了等同于专业新闻记者的权威启发式。这种权威感扁平化的现象使得受众极其容易被社交平台上的虚假信息和不良行为者所操纵。

#认知科学 #其他 #新闻消费 #算法推荐 #虚假信息

阅读更多:

Liao, Mengqi, et al. “When We Think ‘News Will Find Me’: Relative Credibility of Social-Media Friends, Algorithms, and Editors.” Social Media + Society, vol. 12, no. 2, Apr. 2026, p. 20563051261434801. SAGE Journals, https://doi.org/10.1177/20563051261434801

混合AI架构打造可靠的“发现机器”

如何构建能为复杂问题找到最优解的“发现机器”?圣路易斯华盛顿大学的Shantanu Chakrabartty、Faiek Ahsan及其国际合作团队,提出了一种创新的混合人工智能架构。该架构融合了神经形态计算与量子力学原理,成功打造出一种能够高效、可靠地解决复杂优化问题的新型计算系统,并确保其最终能找到答案。

打开网易新闻 查看精彩图片

基于 ON-OFF 神经元的高阶伊辛机架构。Credit: Nature Communications (2026).

该研究的核心是一种结合了两大关键技术的混合系统。首先,它采用受神经形态启发的自编码器,通过模拟大脑处理信息的方式,将复杂的高阶问题分解,从而高效处理包含数万亿因素的难题。其次,系统引入了福勒-诺德海M退火算法,这是一种借鉴自量子力学的工具,能通过生成随机性让机器“隧穿”式地直接找到最优解决方案,极大地加速了求解过程。研究团队通过解决MAX-CUT和MAX-SAT等基准优化问题验证了该架构的有效性。结果表明,该系统不仅能持续产出高质量的解决方案,其求解速度也极具竞争力。最重要的是,该架构提供了收敛保证,意味着它不像某些超级计算机可能在长时间运行后一无所获,而是确保在一定时间后总能得出一个有用的结果。研究发表在 Nature Communications 上。

#AI驱动科学 #计算模型与人工智能模拟 #神经形态计算 #量子退火 #组合优化

阅读更多:

Ahsan, Faiek, et al. “Higher-Order Neuromorphic Ising Machines—Autoencoders and Fowler-Nordheim Annealers Are All You Need for Scalability.” Nature Communications, Apr. 2026. www.nature.com, https://doi.org/10.1038/s41467-026-71937-4

新型量子点发射器实现电信波段高相干光子高效发射

如何将高性能的量子光源与我们现有的光纤通信系统无缝连接?这是构建大规模量子网络的核心挑战。由哥本哈根大学尼尔斯·玻尔研究所的Marcus Albrechtsen和Leonardo Midolo等人组成的国际团队攻克了这一难题,他们开发出一种新型量子点光子发射器,首次在标准电信波段实现了高纯度、高效率的单光子发射,为量子互联网的未来发展铺平了道路。

打开网易新闻 查看精彩图片

用于研究电信量子点的实验装置。该量子点器件在约 4 开尔文的低温装置中进行测量,并与用于共振激发和单光子测量的光学平台相连。Credit: Marcus Albrechtsen/ Niels Bohr Institute, University of Copenhagen.

研究团队通过精密的材料生长和纳米加工技术,制造出一种基于量子点(quantum dots,一种能捕获电子并可控发射单个光子的微小半导体结构)的高性能光子源。该器件的核心创新在于,它不仅能直接在电信O波段(telecom O-band)工作,还通过将量子点嵌入p-i-n二极管结构并构建光子晶体波导,极大地抑制了环境噪声,并增强了光子发射效率。实验结果显示,该发射器能以每秒超过4000万个光子的惊人速率发射单光子,且这些光子近乎完全相同,相干性高达92%。这意味着光子的量子态能够稳定、可预测地保持,解决了长期以来困扰该领域的技术瓶颈。这一突破使得量子光源无需复杂的频率转换,即可直接与低损耗光纤和成熟的硅光子学平台集成,极大地推动了可扩展量子通信系统和容错量子计算机的研发进程。研究发表在 Nature Nanotechnology 上。

#量子技术 #量子通信 #量子点 #光子学

阅读更多:

Albrechtsen, Marcus, et al. “A Quantum-Coherent Photon–Emitter Interface in the Original Telecom Band.” Nature Nanotechnology, Apr. 2026, pp. 1–6. www.nature.com, https://doi.org/10.1038/s41565-026-02156-7

当AI设计蛋白质时,我们如何确保它没有恶意?

蛋白质AI模型正以前所未有的能力重塑生物学研究,但其“黑箱”本质也引发了对可信度和安全性的担忧。来自欧洲多家研究机构的Andrea Hunklinger与Noelia Ferruz等研究人员发布了一份综合性路线图,系统地探讨了如何利用可解释人工智能(XAI)打开蛋白质模型的内部世界,确保其发展可控且可信。

研究团队指出,当前强大的蛋白质基础模型(protein language models,pLMs)虽然成果斐然,但其决策逻辑对人类而言是不透明的。为了解决这一问题,他们通过梳理数十项前沿研究,构建了一个XAI应用框架,将解释方法分为训练数据、输入、模型内部和输入-输出行为四个层面。研究发现,目前XAI在蛋白质研究中多扮演“评估者”的角色,即检查模型是否学到了已知的生物学知识。然而,研究人员认为,XAI的潜力远不止于此,并定义了从“多任务处理者”到“工程师”、“教练”,直至最终目标——“教师”的五重角色。达到“教师”阶段的AI将能揭示人类尚未发现的生物学新规律,成为真正的科研伙伴。此外,该研究强调可解释性是生物安全的基石,只有理解模型的决策依据,才能识别和预防AI在设计蛋白质时可能引入的未知风险。研究发表在 Nature Machine Intelligence 上。

#AI驱动科学 #计算模型与人工智能模拟 #可解释AI #蛋白质语言模型 #生物安全

阅读更多:

Hunklinger, Andrea, and Noelia Ferruz. “Towards the Explainability of Protein Language Models.” Nature Machine Intelligence, May 2026, pp. 1–14. www.nature.com, https://doi.org/10.1038/s42256-026-01232-w

语言模型在处理医院结构化数据方面表现不佳

大语言模型(LLM)能否简化医院日常的数据分析任务,从而减少对专业数据分析师的依赖?为探究此问题,来自西奈山伊坎医学院的Eyal Klang, Benjamin Glicksberg及其同事,对九款主流LLM处理真实电子健康记录(EHR)的能力进行了评估。研究发现,当前LLM无法独立、准确地处理结构化数据,必须结合代码生成与执行的混合策略才能确保可靠性。

研究团队使用了来自西奈山医疗系统50,000次真实急诊就诊的电子健康记录(EHR)数据,对包括GPT-4o和Llama在内的九款主流大型语言模型进行了测试。任务设定为医院管理者日常依赖的两项基本操作:根据特定条件计数患者和基于多重标准筛选记录。研究人员比较了三种不同的提示策略:直接提问、思维链推理,以及一种基于工具的方法,即要求模型生成可执行的Python代码来完成任务。结果显示,直接提问的准确率普遍很低。思维链策略虽有少量提升,但随着数据表格规模的增大,其性能急剧下降,即使是表现最好的GPT-4o,准确率也从约95%骤降至60%以下。相比之下,基于工具的方法表现最佳,GPT-4o和Qwen-2.5-72B等顶级模型实现了近乎完美的准确率。然而,一些为速度和效率优化的模型(如DeepSeek)即便在此模式下也表现不佳。研究结论明确指出,在不借助代码执行的情况下,当前的LLM尚不适合独立用于临床管理中的结构化数据处理。为了在医疗场景中安全、可靠地应用这些技术,必须采用将LLM与传统代码执行相结合的智能体策略。研究发表在 PLOS Digital Health 上。

#AI驱动科学 #自动化科研 #大语言模型 #电子健康记录

阅读更多:

Klang, Eyal, et al. “Large Language Models Are Poor Clinical Administrators: An Evaluation of Structured Queries in Real-World Electronic Health Records.” PLOS Digital Health, vol. 5, no. 5, May 2026, p. e0001326. PLoS Journals, https://doi.org/10.1371/journal.pdig.0001326

整理|ChatGPT

编辑|丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。

研究院还建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。