█脑科学动态
Nature:猪肝在人体内成功运转10天,短期功能稳定
Nature:人类大脑能量图谱,高认知区域线粒体更密集高效
Nature:高脂饮食偷走你的食欲,是大脑神经降压素在"罢工"
脑网络标准化工具NCT发布:解决神经科学“同名不同义”难题
首次绘制人脑-血液代谢交换图谱
未婚者患痴呆症风险更低
孕晚期高糖饮食,宝宝更爱哭
D2神经元是消除恐惧记忆的开关
运动时视觉主导,静止时听觉优先
█AI行业动态
谷歌Gemini 2.5 Pro实验版登顶多项基准测试
Qwen2.5-Omni:首款“全感官”AI模型,能看会听还能实时对话
DeepMind提出了新的大型语言模型防御机制
█AI驱动科学
Cell:AI分析揭示孤独症诊断关键:重复行为更具特异性
类脑忆阻器控制器功耗仅为传统方案的0.25%
类脑AI“超级图灵”实现实时学习,能耗仅为传统AI的百万分之一
AI聊天机器人Therabot疗效媲美“黄金标准”心理治疗
医生为何想关掉AI?医疗智能的“责任陷阱”亟待破解
文化差异决定人类对AI的态度:日本更尊重机器人
神经网络学会“犹豫”,医疗诊断准确性翻倍
脑科学动态
Nature:猪肝在人体内成功运转10天,短期功能稳定
面对全球肝移植供体短缺,空军军医大学西京医院,在中国科学院院士窦科峰教授的领衔下,首次将六基因编辑猪肝移植至脑死亡受试者体内。10天试验显示猪肝可分泌胆汁和白蛋白,血流稳定且无排斥反应,为未来临时性“桥接器官”提供可能。
团队采用异位辅助移植(heterotopic auxiliary transplantation,保留患者原肝脏)技术,将经六基因编辑(敲除引发排斥的GGTA1/CMAH基因,插入人类血栓调节蛋白等)的小型猪肝脏植入受试者。术后监测显示:猪肝2小时即分泌金黄色胆汁,10天累计66.5毫升;猪源性白蛋白(albumin,维持血液渗透压的关键蛋白)水平上升;肝功能指标丙氨酸氨基转移酶(ALT)正常,天门冬氨酸氨基转移酶(AST)短暂升高后回落。超声检测显示猪肝动脉、门静脉血流速度稳定。免疫方面,抗胸腺细胞球蛋白(anti-thymocyte globulin)抑制T细胞,术后3天B细胞激活后被利妥昔单抗(rituximab,一种靶向B细胞的单抗)控制,免疫球蛋白(IgG/IgM)水平无显著变化。组织学分析证实猪肝再生能力良好,无排斥迹象。但猪肝功能仍逊于人类,需延长研究周期验证长期安全性。研究发表在 Nature 上。
#疾病与健康 #个性化医疗 #异种移植 #基因编辑 #肝脏移植
阅读更多:
Tao, Kai-Shan, et al. “Gene-Modified Pig-to-Human Liver Xenotransplantation.” Nature, Mar. 2025, pp. 1–8. www.nature.com, https://doi.org/10.1038/s41586-025-08799-1
Nature:人类大脑能量图谱,高认知区域线粒体更密集高效
大脑能量代谢与健康密切相关,但线粒体的分布规律长期未知。哥伦比亚大学欧文医学中心的Martin Picard、波尔多大学Michel Thiebaut de Schotten及团队通过创新方法,绘制了全球首个大脑线粒体能量图谱MitoBrainMap,揭示了不同脑区的能量供给差异。
▷人类大脑体素化和映射。Credit: Nature (2025).
研究采用物理体素化技术,将人脑切片分割为703个3×3×3毫米立方体(对应神经影像分辨率),测量每个立方体的线粒体密度、氧化磷酸化(OXPHOS,能量生成关键过程)酶活性和呼吸能力。结果显示,灰质线粒体数量比白质多50%,且进化较新的高级认知区域(如皮层)线粒体能量转化效率更高。通过逆向线性回归模型,团队将数据扩展到全脑,并验证了模型对同一大脑其他区域的预测准确性。这一发现为理解阿尔茨海默病等疾病的能量机制提供了新方向。研究发表在 Nature 上。
#疾病与健康 #神经机制与脑功能解析 #线粒体 #能量代谢 #认知科学
阅读更多:
Mosharov, Eugene V., et al. “A Human Brain Map of Mitochondrial Respiratory Capacity and Diversity.” Nature, Mar. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08740-6
Nature:高脂饮食偷走你的食欲,是大脑神经降压素在"罢工"
肥胖者常对高热量食物兴趣减退,这一矛盾现象背后的机制不明。加州大学伯克利分校的Stephan Lammel团队发现,长期高脂肪饮食会降低大脑神经降压素(neurotensin)水平,进而削弱多巴胺驱动的进食愉悦感。通过干预神经降压素信号,团队成功恢复小鼠对食物的兴趣并减轻体重。
研究结合行为实验与光遗传学技术,发现正常小鼠的伏隔核(NAcLat)到腹侧被盖区(VTA)神经回路编码进食快感,而高脂饮食小鼠该回路功能失调。基因测序显示,神经降压素表达下降是关键原因。通过饮食调整或基因操作恢复神经降压素后,小鼠对高热量食物动机回升,总摄入量减少,体重下降。研究还发现,神经降压素干预可改善焦虑和运动能力。这一发现为靶向神经降压素的精准肥胖治疗提供新思路。研究发表在 Nature 上。
#疾病与健康 #神经机制与脑功能解析 #肥胖 #神经降压素 #光遗传学
阅读更多:
Gazit Shimoni, Neta, et al. “Changes in Neurotensin Signalling Drive Hedonic Devaluation in Obesity.” Nature, Mar. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08748-y
首次绘制人脑-血液代谢交换图谱
大脑如何通过血液获取能量并排出废物?这一关键问题长期缺乏系统性答案。北京脑科学与类脑研究所戈鹉平、首都医科大学附属北京天坛医院王伊龙和莫大鹏团队通过高通量技术,首次鉴定出1365种代谢物和140种脂质的脑-血交换规律。
▷不同代谢物在人脑中的绝对摄取/释放量和相对摄取/释放百分比。Credit:Neuron(2025).
研究团队采集脑静脉窦、股静脉和股动脉血液样本,利用代谢组学和脂质组学技术,发现大脑每天净吸收656.47 μM葡萄糖和5g谷氨酸,释放439.18 μM谷氨酰胺(glutamine,解毒产物)。脂质中,甘油三酯消耗最多,磷脂酰乙醇胺(PE,细胞膜成分)释放显著。脑静脉狭窄(CVSS)患者葡萄糖代谢异常,而老年人脑葡萄糖摄取随年龄下降。研究发表在 Neuron 上。
#疾病与健康 #神经机制与脑功能解析 #代谢组学 #脑静脉疾病 #衰老
阅读更多:
Wang, Yilong, et al. “Comprehensive Characterization of Metabolic Consumption and Production by the Human Brain.” Neuron, vol. 0, no. 0, Mar. 2025. www.cell.com, https://doi.org/10.1016/j.neuron.2025.03.003
脑网络标准化工具NCT发布:解决神经科学“同名不同义”难题
大脑功能网络的命名和空间定义长期缺乏统一标准,阻碍跨研究比较。来自国际多机构的团队开发了Network Correspondence Toolbox (NCT),通过定量分析神经影像数据与主流图谱(如Yeo2011)的空间对应关系,为领域提供标准化解决方案。
NCT采用Dice系数(空间重叠度指标)和自旋测试(spin test,通过随机旋转数据评估显著性),量化新数据与16个常用图谱的匹配程度。例如,默认网络(default network)在多数图谱中命名一致,但“额顶网络”等存在显著分歧。应用案例显示,HCP工作记忆任务激活与部分图谱匹配度高(Dice系数>0.7),而社交任务结果则差异较大。该工具开源且支持多图谱并行对比,显著提升结果可重复性。研究发表在 Nature Communications 上。
#神经科学 #跨学科整合 #脑网络图谱 #标准化工具 #功能磁共振成像(fMRI)
阅读更多:
Kong, Ru, et al. “A Network Correspondence Toolbox for Quantitative Evaluation of Novel Neuroimaging Results.” Nature Communications, vol. 16, no. 1, Mar. 2025, p. 2930. www.nature.com, https://doi.org/10.1038/s41467-025-58176-9
未婚者患痴呆症风险更低
婚姻是否真能预防痴呆?美国佛罗里达州立大学医学院的Antonio Terracciano和Selin Karakose团队分析了24,107名中老年人数据,发现未婚、离婚和丧偶者的痴呆风险显著低于已婚人群。
▷研究流程图。Credit: Alzheimer's & Dementia(2025).
研究基于美国国家阿尔茨海默病协调中心(NACC)队列,通过Cox回归模型(一种统计方法,用于分析事件发生时间与变量的关系)评估婚姻状态与痴呆症的关系。结果显示,离婚者风险降低34%(HR=0.66),未婚者降低40%(HR=0.60),且阿尔茨海默病(AD)和路易体痴呆(LBD)的关联尤为显著。调整教育、抑郁等15种因素后,离婚和未婚的关联仍存在。研究人员认为,可能因未婚者诊断延迟,或婚姻质量未被充分考量。研究发表在 Alzheimer's & Dementia 上。
#疾病与健康 #预测模型构建 #神经机制与脑功能解析
阅读更多:
Karakose, Selin, et al. “Marital Status and Risk of Dementia over 18 Years: Surprising Findings from the National Alzheimer’s Coordinating Center.” Alzheimer’s & Dementia: The Journal of the Alzheimer’s Association, vol. 21, no. 3, Mar. 2025, p. e70072. PubMed, https://doi.org/10.1002/alz.70072
孕晚期高糖饮食,宝宝更爱哭
孕期饮食如何影响婴儿情绪健康?俄勒冈健康与科学大学团队发现,妊娠晚期高血糖指数(GI)饮食与婴儿6月龄时更高的负面情绪相关。Elinor Sullivan、Hanna Gustafsson和Elizabeth Wood等研究者通过追踪302名孕妇的饮食与代谢数据,首次明确了孕晚期是饮食干预的关键期。
▷研究时间表。Credit: Scientific Reports (2025).
研究采用结构方程模型(SEM),分析孕中晚期母亲的饮食血糖指数(GI,反映食物升糖速度的指标)、体脂率和胰岛素抵抗数据,并通过实验室标准观察和监护人问卷评估婴儿情绪。结果显示,孕晚期高GI饮食(如白面包、薯片)会显著增加婴儿的观察性负面情绪(β=0.14)和悲伤倾向(β=0.17),而孕中期饮食无此影响。这表明胎儿大脑发育在孕晚期对血糖波动更敏感,短期饮食调整可能比长期代谢改变更有效。研究为孕期精准营养干预提供了依据,例如推荐低GI食物(如蔬菜、全谷物)。研究发表在 Scientific Reports 上。
#疾病与健康 #心理健康与精神疾病 #个性化医疗 #孕期营养 #神经发育
阅读更多:
Wood, Elizabeth K., et al. “Higher Prenatal Dietary Glycemic Index in the Third Trimester of Pregnancy Is Associated with Infant Negative Affect at 6 Months.” Scientific Reports, vol. 15, no. 1, Mar. 2025, p. 8357. www.nature.com, https://doi.org/10.1038/s41598-025-91886-0
D2神经元是消除恐惧记忆的开关
大脑如何区分奖励与威胁?米尼奥大学ICVS的Ana João Rodrigues和Carina Soares-Cunha团队发现,伏隔核(NAc)中D1和D2神经元并非传统认为的“对立分工”,而是协同响应刺激,但D2神经元在消除负面联想中起关键作用。
▷D1- 和 D2-MSN 编码正面和负面非条件刺激。Credit: Nature Communications (2025).
研究采用微型显微钙成像技术,实时追踪自由活动小鼠的NAc壳区D1/D2中型多棘神经元(MSNs)活动。结果显示:D1和D2神经元群体均能区分正(如糖水)负(如奎宁)非条件刺激(US),但无法区分预测性线索(CS)。在奖励或惩罚的联想学习中,两类神经元被同步激活,支持协同作用假说。当刺激关联改变(如负面刺激消失),D2神经元活动变化更显著;光遗传抑制证实其是消退厌恶记忆的必要条件。这一发现揭示了情绪障碍(如焦虑症)中“顽固性负面记忆”的神经机制,为靶向D2神经元的疗法提供依据。研究发表在 Nature Communications 上。
#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #光遗传学 #伏隔核
阅读更多:
Domingues, Ana Verónica, et al. “Dynamic Representation of Appetitive and Aversive Stimuli in Nucleus Accumbens Shell D1- and D2-Medium Spiny Neurons.” Nature Communications, vol. 16, no. 1, Jan. 2025, p. 59. www.nature.com, https://doi.org/10.1038/s41467-024-55269-9
运动时视觉主导,静止时听觉优先
大脑如何在运动与静止状态下切换视觉和听觉的优先级?韩国基础科学研究所(IBS)的Lee Seung-Hee团队发现,次级运动皮层(M2)通过抑制听觉信号传递,使运动中的小鼠更依赖视觉决策,而静止时听觉占优。
▷灵活的多感官处理机制。Credit: Nature Communications (2025).
研究结合钙成像和光遗传学,训练小鼠在跑步机上完成视听冲突任务。结果显示:静止时,后顶叶皮层(PPC)因听觉信号抑制视觉神经元而听觉主导;运动时,M2向听觉皮层发送抑制信号,阻断其与PPC的连接(ACPPC通路),但保留听觉至纹状体(ACSTR)的通路,从而减少听觉干扰、增强视觉处理。
进一步实验表明,关闭PPC会迫使小鼠依赖听觉,而抑制M2则消除运动中的视觉优势。尽管听觉皮层仍处理声音,但大脑通过动态调整整合方式适应行为需求。研究揭示了“感官守门人”M2的关键作用,为开发感觉统合障碍疗法提供了靶点。研究发表在 Nature Communications 上。
#神经科学 #神经机制与脑功能解析 #感觉整合 #光遗传学 #钙成像
阅读更多:
Choi, Ilsong, and Seung-Hee Lee. “Locomotion-Dependent Auditory Gating to the Parietal Cortex Guides Multisensory Decisions.” Nature Communications, vol. 16, no. 1, Mar. 2025, p. 2308. www.nature.com, https://doi.org/10.1038/s41467-025-57347-y
AI 行业动态
谷歌Gemini 2.5 Pro实验版登顶多项基准测试,性能与性价比双突破
谷歌最新发布的Gemini 2.5 Pro实验版在多项独立评估中表现卓越,成为当前性能最强的推理模型之一。该模型以“先思考后回答”为特点,目前仅通过AI Studio提供实验性API接口,定价尚未公开。若参考前代Gemini 1.5 Pro的收费标准(每百万输入/输出词元1.25/5美元),其成本将显著低于OpenAI和Anthropic的领先模型(如o1模型15/60美元,Claude 3.7 Sonnet模型3/15美元),性价比优势突出。
在关键基准测试中,Gemini 2.5 Pro刷新多项纪录:MMLU-Pro和GPQA Diamond分别达到86%和83%的历史高分;Humanity’s Last Exam得分从原先的12.3%跃升至17.7%;AIME 2024测试中更是以88%的成绩创下新高。此外,其输出速度达195词元/秒,远超Gemini 1.5 Pro的92词元/秒,接近Gemini 2.0 Flash的253词元/秒。
Gemini 2.5 Pro延续了该系列的核心功能,包括支持100万词元上下文窗口(即将扩展至200万),以及多模态输入(图像、视频、音频,仅限文本输出)。谷歌表示,待全部7项评估完成后将发布更详细的“人工分析智能指数”,进一步验证其综合能力。
#谷歌 #Gemini2.5Pro #AI模型 #基准测试 #多模态
阅读更多:
https://artificialanalysis.ai/https://x.com/ArtificialAnlys/status/1904923020604641471
Qwen2.5-Omni:首款“全感官”AI模型,能看会听还能实时对话
通义千问(Qwen)团队最新推出的Qwen2.5-Omni,标志着多模态大模型技术迈入新阶段。这款端到端全模态模型不仅能处理文本,还能无缝理解图像、语音和视频,实现“看、听、说、写”一体化交互。其创新的Thinker-Talker架构模拟人类认知流程:Thinker模块像“大脑”一样整合多模态输入并生成语义表示,而Talker模块则如“嘴巴”般流式输出自然语音。通过时间对齐位置编码(TMRoPE)技术,模型还能精准同步音视频内容,为实时对话和跨模态任务奠定基础。
Qwen2.5-Omni在性能上全面超越同类产品。音频理解能力优于团队前代模型Qwen2-Audio,视觉处理表现与Qwen2.5-VL-7B持平,甚至在语音合成自然度上击败主流流式生成模型。测试数据显示,其在MMLU、GSM8K等基准任务中表现抢眼,并在多模态评测平台OmniBench上达到业界顶尖水平(SOTA)。无论是语音识别(Common Voice)、视频理解(MVBench),还是跨语言翻译(CoVoST2),该模型均展现出卓越的泛化能力。
未来,Qwen2.5-Omni将赋能语音助手、智能客服、视频分析等场景,其端到端设计显著降低延迟,提升响应一致性。团队透露将继续扩展其能力边界,向“全模态统一”的终极目标迈进。这一突破或重新定义人机交互范式,推动AI应用进入“多感官协同”时代。
#人工智能 #多模态大模型 #Qwen2.5 #语音合成 #实时交互
阅读更多:
https://huggingface.co/Qwen/Qwen2.5-Omni-7B
Google DeepMind提出了新的大型语言模型防御机制
Google DeepMind的研究团队提出了一种名为CaMeL(Capabilities for Machine Learning)的防御机制,旨在为大型语言模型(LLM)构建一个保护层,即使在底层模型可能易受攻击的情况下也能确保其安全性。
随着大型语言模型在各个领域的广泛应用,其安全性问题日益凸显。传统的防御方法通常需要对模型进行重新训练或修改,成本高且复杂。为了解决这一问题,Google DeepMind的研究人员与苏黎世联邦理工学院(ETH Zurich)的团队合作,开发了CaMeL防御机制,旨在提供一种无需修改底层模型即可增强安全性的解决方案。
CaMeL的核心思想是通过在用户查询的控制流和数据流中引入明确的提取过程,防止不受信任的输入直接影响程序逻辑。具体而言,CaMeL采用了双模型架构,包括一个特权LLM(Privileged LLM)和一个隔离LLM(Quarantined LLM)。特权LLM负责总体任务的协调,将敏感操作与潜在有害数据隔离开来;隔离LLM则单独处理数据,并被明确限制其调用工具的能力,以减少潜在风险。此外,CaMeL通过为每个数据值分配元数据或“能力”,定义了严格的策略,规定每个信息的使用方式。一个定制的Python解释器负责执行这些精细的安全策略,监控数据来源,并通过明确的控制流约束确保合规性。这种方法借鉴了软件安全领域的成熟实践,为LLM的安全性提供了新的思路。
#神经技术 #大型语言模型 #防御机制 #Google DeepMind
阅读更多:
https://www.marktechpost.com/2025/03/26/google-deepmind-researchers-propose-camel-a-robust-defense-that-creates-a-protective-system-layer-around-the-llm-securing-it-even-when-underlying-models-may-be-susceptible-to-attacks/
AI 驱动科学
Cell:AI分析揭示自闭症诊断关键:重复行为比社交障碍更具特异性
自闭症诊断长期依赖主观临床评估,缺乏可靠生物标记。麦吉尔大学Danilo Bzdok与蒙特利尔大学Laurent Mottron团队利用AI分析4200份儿童医疗记录,发现重复行为(如固定兴趣)比社交障碍更能准确预测诊断,呼吁修订现行标准。
研究采用大型语言模型,通过预训练数亿通用语句后,微调于4000余份临床报告,实现独立诊断准确率提升。通过可解释性框架,模型锁定报告中与诊断最相关的句子,直接对比DSM-5标准。结果显示,重复动作(如拍手、转圈)和感知异常(如对特定声音敏感)的提及率在确诊患者中显著高于非患者,而社交互动差异(如缺乏眼神交流)的区分度较低。研究者建议降低社交因素权重,以提升诊断效率。这一发现可能缩短诊断延迟(目前需数年),加速干预实施。研究发表在 Cell 上。
#疾病与健康 #预测模型构建 #大模型技术 #心理健康与精神疾病
阅读更多:
Stanley, Jack, et al. “Large Language Models Deconstruct the Clinical Intuition behind Diagnosing Autism.” Cell, vol. 0, no. 0, Mar. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.02.025
类脑忆阻器控制器功耗仅为传统方案的0.25%
传统机器人控制器因高功耗限制设备续航与体积。密歇根大学Xiaogan Liang团队开发了一种基于忆阻器的类脑计算系统,通过模拟神经网络实现高效控制,功耗低至12.5微瓦,性能媲美数字方案。
▷目标跟踪探测车导航任务。Credit: Science Advances (2025).
研究采用硒化铋(Bi₂Se₃)动态忆阻器构建储备池计算(Reservoir Computing, RC)网络,通过摩擦诱导选择性沉积(RISS)工艺制备。该网络将传感器输入的时序信号非线性映射到高维空间,结合短期记忆特性生成控制指令,无需复杂训练。在滚动机器人目标追踪测试中,系统响应速度与精度与传统控制器相当,功耗仅为其0.25%;无人机杠杆平衡任务中,误差率(NRMSE)为1.25。研究突破了传统数字计算的能效瓶颈,为边缘计算(Edge Computing)和微型机器人提供了新方案。研究发表在 Science Advances 上。
#AI驱动科学 #自动化科研 #边缘计算 #忆阻器 #机器人控制
阅读更多:
Chen, Mingze, et al. “Nanoelectronics-Enabled Reservoir Computing Hardware for Real-Time Robotic Controls.” Science Advances, vol. 11, no. 13, Mar. 2025, p. eadu2663. science.org (Atypon), https://doi.org/10.1126/sciadv.adu2663
类脑AI“超级图灵”模型实现实时学习,能耗仅为传统AI的百万分之一
AI的高能耗问题制约其发展,而人脑的高效性提供了解决思路。德克萨斯农工大学的Suin Yi团队开发出“超级图灵AI”,通过模拟人脑突触可塑性,将学习与记忆功能整合,大幅降低能耗。
▷Synstor 电路的结构。Credit: Science Advances (2025).
团队设计了一种突触电阻电路,采用铁电材料HfZrO,使AI在运行中同步调整算法(类似人脑的赫布学习规则,即“共同激活的神经元连接增强”)。实验中,未预训练的无人机通过该电路在模拟强风环境中实时避障,学习速度比传统人工神经网络(ANN)快10倍,功耗仅20瓦(传统数据中心需吉瓦级电力)。此外,其适应性接近人类操作员,解决了传统AI在未知环境中易失效的难题。研究成果发表于 Science Advances 上。
#AI驱动科学 #神经机制与脑功能解析 #计算模型与人工智能模拟 #节能AI #类脑计算 #突触可塑性
阅读更多:
Lee, Jungmin, et al. “HfZrO-Based Synaptic Resistor Circuit for a Super-Turing Intelligent System.” Science Advances, vol. 11, no. 9, Feb. 2025, p. eadr2082. science.org (Atypon), https://doi.org/10.1126/sciadv.adr2082
AI聊天机器人Therabot疗效媲美“黄金标准”心理治疗
心理健康服务供需失衡问题严峻,美国平均每位治疗师需服务1600名抑郁或焦虑患者。达特茅斯学院的Nicholas Jacobson和Michael Heinz团队开发了生成式AI治疗聊天机器人Therabot,首次临床试验表明其可显著缓解抑郁、焦虑及饮食失调症状,效果接近传统门诊治疗。
研究采用随机对照试验(RCT),将210名患者分为Therabot干预组和对照组。干预组通过智能手机应用与Therabot进行开放式对话,对话内容基于认知行为疗法(CBT)最佳实践。结果显示,8周后干预组的抑郁症状平均减少51%(对照组仅4.22%),焦虑症状减少31%,饮食失调相关担忧下降19%,效果量(Cohen’s d)达0.627–0.903。用户平均使用6小时,治疗联盟评分与真人治疗无显著差异。研究还发现,用户常在夜间主动发起对话,将Therabot视为“无评判的朋友”。该研究提示AI可弥补心理健康服务缺口,但需临床医生监督以确保安全。研究发表在 New England Journal of Medicine AI 上。
#AI驱动科学 #疾病与健康 #心理健康与精神疾病 #个性化医疗 #大模型技术
阅读更多:
Heinz, Michael V., et al. “Randomized Trial of a Generative AI Chatbot for Mental Health Treatment.” NEJM AI, Mar. 2025. world, ai.nejm.org, https://ai.nejm.org/doi/abs/10.1056/AIoa2400802
医生为何想关掉AI?医疗智能的“责任陷阱”亟待破解
医疗AI的普及面临临床医生抵触风险,主因是工具负担过重、责任不明及决策干扰。约克大学、布拉德福德健康研究所等团队通过Shared CAIRE项目调研六类AI工具的实际影响,发布白皮书提出七项改革建议,呼吁政府与开发者优先解决责任分配与临床参与问题。
▷自主决策支持工具的临床工作流程。Credit: arXiv (2025).
研究采用混合方法,结合临床场景测试与伦理法律分析,发现现有AI工具因产品责任制度缺陷,迫使医生成为“责任承担者”(liability sink)。例如,提供明确治疗建议的AI可能引发法律风险,而仅展示数据(如风险评分)的工具更受青睐。团队提出分级委托标准:AI在特定条件下自主处理简单病例(如病理图像初筛),复杂病例仍由医生主导。
此外,AI设计需纳入临床反馈,避免界面冗余或信息过载。例如,某病理AI经医生参与优化后,诊断效率提升30%,但未参与的同类工具因操作繁琐遭弃用。研究强调,改革需同步推进:修订产品责任法、强制临床培训、明确AI与医生决策权界限。
#AI驱动科学 #疾病与健康 #个性化医疗 #跨学科整合 #责任归属
阅读更多:
Jia, Yan, et al. The Case for Delegated AI Autonomy for Human AI Teaming in Healthcare. arXiv:2503.18778, arXiv, 24 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.18778
文化差异决定人类对AI的态度:日本更尊重机器人
自动驾驶时代,人类如何与AI共享公共空间成为关键问题。慕尼黑大学Jurgis Karpus与早稻田大学团队通过博弈实验发现,日本人对机器人和人类一视同仁,而西方人更倾向利用AI。
研究采用经典博弈论实验(如囚徒困境,模拟利益冲突的决策场景),要求日本和美国参与者在人类或AI对手间选择合作或自私策略。结果显示,美国参与者对AI的合作率比人类低27%,而日本参与者对两者无差别。情感分析表明,日本人对剥削机器人和人类同样感到内疚,而西方人仅对剥削人类产生道德负担。研究者认为,这种文化差异可能源于日本神道教和佛教中的“泛灵论”传统,将机器视为有灵魂的实体。研究建议,在AI伦理设计和政策制定中需纳入文化视角,例如全自动出租车在东京的接受度可能高于柏林。研究发表在 Scientific Reports 上。
#认知科学 #跨学科整合 #自动化伦理 #文化差异 #博弈论
阅读更多:
Karpus, Jurgis, et al. “Human Cooperation with Artificial Agents Varies across Countries.” Scientific Reports, vol. 15, no. 1, Mar. 2025, p. 10000. www.nature.com, https://doi.org/10.1038/s41598-025-92977-8
神经网络学会“犹豫”,医疗诊断准确性翻倍
神经网络在医疗等高风险场景中常因过度自信引发误判。Skoltech AI Center的Aleksandr Yugay、Alexey Zaytsev团队联合俄罗斯科学院信息传输问题研究所,开发出基于“软标签”训练的新方法,使模型能主动识别不确定性,血型分类任务评估准确性提升2倍。
研究采用“软标签”(soft labels,专家标注的0-1置信度)替代传统二分类标签,训练模型区分认知不确定性(epistemic uncertainty,数据不足导致)和偶然不确定性(aleatoric uncertainty,数据噪声引发)。通过血型数据集(3139张图像)和病理切片测试,模型在分类任务中不确定性评估质量达到SotA(State-of-the-Art)水平的2倍,分割任务提升62%。例如,模型会对模糊血型图像输出低置信度,提示人工复核,减少误诊风险。该技术可扩展至工业检测、自动驾驶等领域。
#AI驱动科学 #预测模型构建 #个性化医疗 #不确定性量化 #神经网络
阅读更多:
Korchagin, S. A., et al. Improving Uncertainty Estimation with Confidence-Aware Training Data. Semantic Scholar, https://www.semanticscholar.org/paper/Improving-Uncertainty-Estimation-with-Training-Data-Korchagin-Zaychenkova/fc00f3d7004a1338ad431e9eb364dd18106f4a72. Accessed 28 Mar. 2025
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。
热门跟贴