脑科学动态

突触强度决定睡眠的质量

斑马鱼端脑空间表征的群体代码

海马体在熟练动作控制中的新角色

cohesin蛋白的缺失导致神经再生障碍

血清素水平随奖励价值增加

鼻用艾氯胺酮联合抗抑郁药显著改善难治性抑郁症患者症状

右侧丘脑底核深部脑刺激有助于帕金森病患者语言流畅性

脊髓电路如何调节自主运动中的反射机制

AI行业动态

新型抗精神分裂症药物获FDA批准,开辟治疗新路径

AlphaChip:AI加速芯片设计的革命性工具

生成式AI全面赋能各行业,Google展示185个实际应用案例

Molmo:开源多模态模型的创新,性能紧追GPT-4o

AI研发动态

生成型人工智能GPT-4在患者安全领域表现出色

新型形变适应脑传感器为癫痫个性化治疗提供突破

双IMC方案革新存储内计算技术,提高机器学习能效

新的评估框架助力医疗保健领域大型语言模型的人类评估

多语言医学语言模型的突破:MMed-Llama 3 接近 GPT-4

脑科学动态

突触强度决定睡眠的质量

筑波大学的研究团队着重研究了突触强度与睡眠稳态之间的关系。研究人员发现,尽管睡眠剥夺会增加后续睡眠的时长与深度,具体的生物机制尚不明朗。该团队开发了一个名为SYNCit-K的分子工具,能够增强突触强度,同时引入了兴奋-抑制神经网络(EIN)模型来预测这种突触增强如何影响大脑活动。

研究团队利用SYNCit-K这一工具,通过化学诱导的蛋白转移机制增强了小鼠前额叶皮层中突触的强度。同步的数学模型表明,增强的突触强度能够促进神经元进入“低活跃状态”,并显著增加睡眠中的δ波。实验结果显示,突触增强引发了非快速眼动(NREM)睡眠的延长,且当突触强度在睡眠后恢复到正常水平时,睡眠深度也随之调整。研究还表明,阻止突触增强会抑制深度睡眠的发生。该成果不仅验证了EIN模型的预测,也为未来通过调控突触强度来改善睡眠质量提供了潜在的治疗方向。研究发表在 Science 上。

#神经技术 #突触强度 #睡眠稳态 #非快速眼动睡眠 #数学模型

阅读论文:

Sawada, Takeshi, et al. “Prefrontal Synaptic Regulation of Homeostatic Sleep Pressure Revealed through Synaptic Chemogenetics.” Science, Sept. 2024. world, www.science.org, https://www.science.org/doi/10.1126/science.adl3043.

斑马鱼端脑空间表征的群体代码

由中国科学院上海微系统与信息技术研究所的李孟教授带领的合作团队,首次发现了在斑马鱼脑中存在与哺乳动物类似的空间位置细胞。这些细胞之前只在哺乳动物和鸟类中发现过,研究为进一步探索不同物种如何构建空间认知提供了新的模型。

研究人员通过跟踪显微镜(tracking microscopy),观察自由游动的幼年斑马鱼脑中的钙离子活动,分析每个神经元的空间信息。斑马鱼的透明身体使得研究人员能够直接观察其大脑活动。实验中,研究人员识别出约1000个位置细胞,其中大部分只在鱼类位于特定位置时活跃,而少数细胞对多个区域作出反应。这些位置细胞主要位于斑马鱼的端脑区域(telencephalon)。

通过操纵外部线索和自我运动信息,研究发现斑马鱼能够灵活整合多种输入,形成灵活的空间地图。研究还表明,斑马鱼可以记住多个环境并在不同环境间切换。斑马鱼空间位置细胞的发现揭示了位置细胞在不同物种之间的一致性,为理解跨物种的空间认知和导航机制提供了重要的新视角。研究发表在 Nature 上。

#认知科学 #位置细胞 #空间认知 #斑马鱼 #神经科学

阅读论文:

Yang, Chuyu, et al. “A Population Code for Spatial Representation in the Zebrafish Telencephalon.” Nature, Aug. 2024, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-024-07867-2.

海马体在熟练动作控制中的新角色

伯明翰大学的研究人员挑战了长期以来关于海马体仅负责记忆和空间导航的传统认知,揭示了它在控制熟练动作中的作用。研究团队通过功能性磁共振成像(fMRI)重新分析了24名参与者在记忆状态下完成熟练的指序按键任务时的脑部活动,重点关注基底神经节、丘脑和小脑等关键皮层下区域的活动。

这些区域传统上与“肌肉记忆”(motor memory)相关,但研究表明它们的活动虽然增加,却未提供关于动作序列身份的信息。相反,海马体(hippocampus)的活动在动作计划阶段增加,且准确预测了即将执行的动作顺序。这表明,海马体在动作序列的预排序中发挥了重要作用,帮助大脑系统灵活地切换熟练动作序列。该研究挑战了长期以来将情景记忆和程序记忆严格区分的观念,为神经退行性疾病患者的康复训练提供了新思路。研究发表在 The Journal of Neuroscience 上。

#神经科学 #熟练动作控制 #记忆 #海马体 #神经康复

阅读论文:

Yewbrey, Rhys, and Katja Kornysheva. “The Hippocampus Pre-Orders Movements for Skilled Action Sequences.” Journal of Neuroscience, Sept. 2024. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.0832-24.2024.

cohesin蛋白的缺失导致神经再生障碍

由俄亥俄州立大学韦克斯纳医学中心与伦敦帝国学院的研究人员联合进行的最新研究,揭示了DNA三维结构在神经损伤修复中的关键作用。研究团队通过Hi-C(染色体构象捕获技术)和RNA测序等方法,分析了小鼠感知背根神经节中的三维染色质结构及基因表达情况。

结果表明,参与轴突再生的基因依赖于复杂的远程染色质环结构(chromatin loops),这些环结构由cohesin蛋白(连接染色体结构的蛋白复合物)维持。正常情况下,这些染色质环允许远距离的基因与增强子相互作用,从而激活再生基因。当cohesin缺失时,这些环无法正确形成,导致染色质结构的破坏和神经再生障碍。此外,研究还发现,这种远程基因相互作用机制在人类胎儿皮层中更为丰富,特别是在神经发育的早期阶段。该研究首次绘制了体内成年感知神经元的三维染色质结构图,提出了未来通过激活cohesin以增强神经再生的潜在治疗方向。研究发表在 PNAS 上。

#神经技术 #DNA结构 #神经再生 #cohesin

阅读论文:

Palmisano, Ilaria, et al. “Three-Dimensional Chromatin Mapping of Sensory Neurons Reveals That Promoter–Enhancer Looping Is Required for Axonal Regeneration.” Proceedings of the National Academy of Sciences, vol. 121, no. 38, Sept. 2024, p. e2402518121. pnas.org (Atypon), https://doi.org/10.1073/pnas.2402518121.

血清素水平随奖励价值增加

血清素是一种重要的神经递质,长期以来被认为与情绪和行为调节密切相关。然而,关于血清素在奖励情境中的释放时机和具体机制,研究还存在诸多未知。达特茅斯学院心理与脑科学系的研究团队由Kate Nautiyal教授带领,通过一种新型的光纤光度技术首次实时测量了小鼠大脑中的血清素释放,为血清素在奖励调控中的作用提供了新的证据。

研究团队使用了一种名为GRAB-5HT的基因编码荧光生物传感器,结合光纤光度技术,能够在小鼠大脑中即时检测到血清素的释放动态。实验中,研究人员通过让小鼠获得不同浓度的奖励,并监测血清素在背内侧纹状体中的变化。结果显示,当奖励的浓度越高,血清素的释放水平越高;而当小鼠得到奖励的提示时,血清素水平也随之上升。此外,实验还发现,血清素不仅与奖励的消费有关,还能编码对奖励的预期和主观价值。这些发现为理解血清素在奖励调控中的作用机制提供了新的线索,或有助于开发更为精准的精神疾病治疗方法。研究成果发表在 The Journal of Neuroscience 上。

#大脑健康 #血清素 #奖励机制 #精神疾病 #神经技术

阅读论文:

Spring, Mitchell G., and Katherine M. Nautiyal. “Striatal Serotonin Release Signals Reward Value.” Journal of Neuroscience, Aug. 2024. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.0602-24.2024.

鼻用艾氯胺酮联合抗抑郁药显著改善难治性抑郁症患者症状

研究由美国德克萨斯西南医学中心的Madhukar Trivedi教授及其团队主导,旨在解决约三分之一的重度抑郁症患者面临的治疗难题——难治性抑郁症(TRD)。这些患者对两种或以上的口服抗抑郁药(OADs)无效,而传统疗法对他们的症状改善有限。该研究团队分析了三项国际临床试验的数据,评估艾氯胺酮(Esketamine)联合新启动的OAD的治疗效果。

研究方法基于两项设计类似的随机对照研究TRANSFORM-1和TRANSFORM-2,以及一项预防复发的SUSTAIN-1研究。这些试验比较了鼻用艾氯胺酮(Esketamine, ESK)联合新启动的口服抗抑郁药(OAD)与OAD加安慰剂(PBO)的效果。研究团队使用协方差分析评估PHQ-9评分(患者健康问卷九项,一种衡量抑郁症严重程度的自评量表)的变化。

结果显示,ESK + OAD组在28天内的PHQ-9评分平均降低了12.8分,而OAD + PBO组则降低了10.3分,二者有显著差异(P < .001)。此外,ESK + OAD组中有77.1%的患者PHQ-9评分改善6分以上,而OAD + PBO组为64%(P < .001)。在维持治疗研究SUSTAIN-1中,57.3%的ESK + OAD组患者在治疗结束时仍保持症状缓解(PHQ-9评分≤4),而OAD + PBO组仅为44.2%(P = .044)。这些结果表明,艾氯胺酮与新启动的OAD联合使用,显著提高了TRD患者的缓解率。研究发表在 CNS Spectrums 上。

#大脑健康 #艾氯胺酮 #难治性抑郁症 #临床试验 #抗抑郁药

阅读论文:

Sliwa, Jennifer Kern, et al. “Effects of Esketamine Nasal Spray on Depressive Symptom Severity in Adults with Treatment-Resistant Depression and Associations between the Montgomery–Åsberg Depression Rating Scale and the 9-Item Patient Health Questionnaire.” CNS Spectrums, vol. 29, no. 3, June 2024, pp. 176–86. Cambridge University Press, https://doi.org/10.1017/S1092852924000105.

右侧丘脑底核深部脑刺激或有助于保持帕金森病患者的语言流畅性

帕金森病患者的运动症状治疗中,深部脑刺激(DBS)是一种有效的选择。然而,传统的双侧刺激可能导致语言流畅性下降。阿拉巴马大学伯明翰分校的研究团队,包括Victor Del Bene博士和Harrison Walker博士,开展了一项研究,旨在评估单侧DBS对语言流畅性和认知功能的影响。该研究由美国国立卫生研究院的脑创新神经技术研究计划资助。

这项研究纳入了31名帕金森病患者,这些患者接受了单侧丘脑底核(STN)的深部脑刺激(DBS)。研究通过随机、双盲、交叉的设计,比较了定向(directional)和环形(ring)刺激的效果。所有患者的刺激电极均植入在病变更严重的一侧大脑半球。认知功能的评估指标包括语言流畅性、听觉-语言记忆和反应抑制。结果表明,定向和环形刺激对认知功能的影响没有显著差异,但植入电极的大脑半球影响了认知表现。左侧STN DBS导致患者语言流畅性下降,而右侧STN DBS则提高了语言流畅性和反应抑制能力。研究推测,对于右半球运动功能受损较为严重的帕金森病患者,单侧右侧STN DBS可能减少双侧DBS所导致的语言流畅性下降。研究发表在 Annals of Neurology 上。

#神经技术 #帕金森病 #语言流畅性 #深部脑刺激 #单侧刺激

阅读论文:

Del Bene, Victor A., et al. “Differential Cognitive Effects of Unilateral Subthalamic Nucleus Deep Brain Stimulation for Parkinson’s Disease.” Annals of Neurology, vol. 95, no. 6, 2024, pp. 1205–19. Wiley Online Library, https://doi.org/10.1002/ana.26903.

脊髓电路如何调节自主运动中的反射机制

南加州大学Alfred E. Mann生物医学工程系的Francisco Valero-Cuevas教授及其团队长期致力于研究神经肌肉控制。他们的最新研究探讨了脊髓和大脑在协调自主运动中的复杂交互机制,重点研究了脊髓反射如何在不影响自主运动的情况下被调节或抑制。该研究由生物医学工程博士生Grace Niyo领导,旨在揭示脊髓电路在维持运动平稳性中的关键作用。

研究团队使用了物理模拟软件MuJoCo,构建了猕猴手臂的生物力学模型,通过模拟超过1000次抓取动作,探索了拉伸反射(stretch reflexes)在自主运动中的影响。拉伸反射是一种速度依赖的反应,当肌肉被拉伸时会触发。然而,这种反应在自主运动中常常会引发运动的扰动。为了验证是否存在脊髓电路可以调节这些扰动,研究人员模拟了α运动神经元通过侧支连接到γ运动神经元的机制,结果显示,这种机制显著减少了拉伸反射引发的扰动,使运动更加平滑和精准。这项研究揭示了脊髓中存在的一个尚未完全理解的调节机制,并为未来治疗与运动相关的神经系统疾病提供了新的方向。研究发表在 PNAS 上。

#神经技术 #脊髓反射 #自主运动 #神经肌肉控制 #脊髓电路

阅读论文:

Niyo, Grace, et al. “A Computational Study of How an α- to γ-Motoneurone Collateral Can Mitigate Velocity-Dependent Stretch Reflexes during Voluntary Movement.” Proceedings of the National Academy of Sciences, vol. 121, no. 34, Aug. 2024, p. e2321659121. pnas.org (Atypon), https://doi.org/10.1073/pnas.2321659121.

AI 行业动态

新型抗精神分裂症药物获FDA批准,开辟治疗新路径

美国食品药品监督管理局(FDA)近日批准了一种全新类型的抗精神分裂症药物Cobenfy(xanomeline/trospium chloride),这是几十年来首次采用新方法治疗该病的药物。Cobenfy通过影响胆碱能受体,间接调节神经递质乙酰胆碱的活动,减少幻觉和“听到声音”等症状,同时避免了传统药物带来的体重增加和疲乏等副作用。

精神分裂症是一种严重的慢性精神疾病,全球大约1%的人口受到影响,患者常出现干扰生活的妄想、幻觉(包括听到不存在的声音)以及偏执等症状。现有的治疗方法多通过阻断脑部多巴胺受体来控制症状,但副作用较大,导致患者常常中断用药。Cobenfy的研发为这一困境提供了新的解决方案。

根据FDA数据,Cobenfy在两项为期五周的双盲试验中显示出明显的疗效,患者的症状在标准评估量表上有显著改善。虽然药物的长期安全性尚未明确,但试验中的副作用主要集中在胃肠道反应,如恶心、消化不良和便秘等。Cobenfy不适用于肝功能受损的患者。此外,Cobenfy未被列入FDA的黑框警告名单,这使其与传统抗精神分裂症药物有所不同。Bristol Myers Squibb公司计划在2024年晚些时候发布更长期的研究结果。

#精神分裂症 #Cobenfy #新型药物 #FDA批准 #BristolMyersSquibb

阅读更多:

Kingwell, Katie. “FDA Approves First Schizophrenia Drug with New Mechanism of Action since 1950s.” Nature Reviews Drug Discovery, Sept. 2024. www.nature.com, https://doi.org/10.1038/d41573-024-00155-8.

AlphaChip:AI加速芯片设计的革命性工具

AlphaChip是Google推出的一项突破性AI技术,专门用于优化芯片布局设计。自2020年首次发布以来,AlphaChip已被应用于Google自定义的AI加速器Tensor Processing Unit(TPU)的最新三代设计中,其成果显著提升了芯片设计的速度和性能。

AlphaChip通过强化学习,将芯片布局设计任务视为一种复杂的游戏,逐步将电路组件放置在空白网格上。不同于传统的手工设计方法,这一AI系统可以在数小时内生成超越人类水平的芯片布局,显著缩短设计周期。尤其是在Google的TPU设计中,AlphaChip已成为不可或缺的工具,使AI模型能够大规模扩展。

除了在Google内部应用,AlphaChip也被外部组织采用。MediaTek(联发科技)等公司已利用AlphaChip加速其高端芯片的开发,提高了性能、功耗和芯片面积。该技术不仅推动了AI加速器设计,还促进了逻辑综合、宏单元选择等芯片设计的其他关键阶段。

#AlphaChip #芯片设计 #强化学习 #TPU #AI

阅读更多:

https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/

生成式AI全面赋能各行业,Google展示185个实际应用案例

Google近期发布了一篇文章,介绍了全球185个生成式AI(Generative AI)在多个行业中的实际应用。这些应用涵盖了客户服务、员工管理、代码开发、数据分析、安全管理和创意设计等广泛领域,展示了AI技术如何帮助企业提高效率和优化流程。

在客户服务方面,阿拉斯加航空(Alaska Airlines)开发了自然语言搜索系统,使旅客可以像与人类交互一样预订航班;麦当劳(McDonald’s)则利用生成式AI提升创新速度和客户体验。在员工管理中,Bayes Impact通过AI辅助的数字案例经理,每周减少了25小时的工作量。

代码开发方面,Leroy Merlin使用Vertex AI构建了代码变更摘要工具,帮助开发者更高效地完成代码评审工作。在数据分析中,CME集团(CME Group)打造了AI驱动的交易平台,支持更智能的商品交易决策。Palo Alto Networks在安全管理中利用生成式AI显著提高了威胁检测和响应速度。

在创意设计领域,PUMA印度通过AI自定义产品照片,提高了点击率,展示了AI在创意生产中的巨大潜力。Google的这篇文章展示了生成式AI如何在各大企业中实际落地,推动行业创新。

#生成式AI #客户服务 #代码开发 #数据分析 #安全管理

阅读更多:

https://blog.google/products/google-cloud/gen-ai-business-use-cases/

Molmo:开源多模态模型的创新,性能紧追GPT-4o

Molmo是一款新型开源多模态人工智能模型,旨在缩小开源系统与专有系统在性能上的差距。该模型基于Qwen2-72B,采用OpenAI的CLIP作为视觉骨干,专注于提高图像和文本的处理能力,特别在复杂的交互场景中表现优异。Molmo支持用户通过2D指向交互与视觉内容进行互动,拓展了其在增强现实和人机交互等领域的应用潜力。

与同类模型相比,Molmo在性能上具有优势,在学术基准测试中获得最高评分,并在人类评估中紧随GPT-4o。该模型完全开源,包含权重、代码、数据和评估系统,显示了其透明性与开放性。

Molmo不仅擅长生成高质量的图像描述和视觉问答,还能结合图像和文本进行信息融合,显著提升用户的交互体验。其多模态交互能力,使其在教育、娱乐和医疗领域具有广泛应用潜力,特别是在医疗图像分析和智能教学等场景中表现出色。

#Molmo #多模态模型 #2D交互 #开源AI #人机交互

阅读更多:

https://molmo.allenai.org/blog

AI 研发动态

生成型人工智能GPT-4在患者安全领域表现出色

随着生成型人工智能(genAI)的发展,其在医疗领域的应用逐渐显现。波士顿大学医学院的Nicholas Cordella博士和James Moses博士领导了一项研究,首次对genAI在患者安全认证考试中的表现进行了测试。研究的核心在于探索GPT-4模型在提升医疗安全方面的潜力。

研究团队使用GPT-4模型的多模态版本(gpt-4-0613)参与了患者安全认证考试(CPPS)的自我评估。这份包含50道题的考试被设计为与实际认证考试在难度、内容和形式上保持一致,测试了AI在多个关键领域的能力。GPT-4在没有额外医学微调的情况下,达到了88%的总体正确率,尤其在患者安全与解决方案、绩效测量以及系统思维和设计/人因(Systems Thinking and Design/Human Factors)等领域表现出色。

尽管其在文化和领导力领域稍显不足,研究人员认为这些结果表明AI可以帮助识别和预防医疗错误,提升医疗安全。研究还警告,当前的AI技术存在一些局限性,如对错误答案的高度自信,这表明未来需要进一步测试和改进。该研究的结论表明,AI技术在提高医疗质量和安全性上有着广阔的前景,但仍需要谨慎对待AI的局限性。研究发表在 Joint Commission Journal on Quality and Patient Safety 上。

#患者安全 #人工智能 #医疗技术 #风险管理

阅读更多:

“Artificial Intelligence and the Practice of Patient Safety: GPT-4 Performance on a Standardized Test of Safety Knowledge.” The Joint Commission Journal on Quality and Patient Safety, vol. 50, no. 10, Oct. 2024, pp. 745–47. www.sciencedirect.com, https://doi.org/10.1016/j.jcjq.2024.05.007.

新型形变适应脑传感器为癫痫个性化治疗提供突破

超声波神经刺激技术因其非侵入性和精准性,近年来被视为治疗耐药性癫痫等神经系统疾病的潜在方法。然而,现有传感器因无法紧密贴合大脑复杂曲面,导致在临床应用中的效果受限。成均馆大学(SKKU)、基础科学研究所(IBS)和韩国科学技术研究院的研究人员,团队由 Donghee Son教授领导,开发了一种新型形变适应皮层黏附传感器,能够精确测量并控制癫痫发作。

这款新型传感器由三层材料构成:第一层为含儿茶酚修饰的藻酸盐水凝胶粘附层,能够与大脑组织紧密结合;第二层是可拉伸的16通道电极阵列,用于高分辨率信号采集;第三层为具有自愈功能的聚合物基底,能够适应大脑表面的复杂曲面。传感器通过与脉冲控制的颅外聚焦超声设备结合,在癫痫大鼠模型中实现了稳定的脑电波记录和个性化闭环治疗。实验结果显示,传感器能够实时检测发作前的高频异常信号,并在超声波刺激下有效控制癫痫发作。未来,研究团队计划进一步提高电极数量,并开发更小创伤的植入技术,以期在临床应用中实现突破。研究发表在 Nature Electronics 上。

#大脑健康 #神经技术 #癫痫治疗 #超声波

阅读更多:

Lee, Sungjun, et al. “A Shape-Morphing Cortex-Adhesive Sensor for Closed-Loop Transcranial Ultrasound Neurostimulation.” Nature Electronics, vol. 7, no. 9, Sept. 2024, pp. 800–14. www.nature.com, https://doi.org/10.1038/s41928-024-01240-x.

双IMC方案革新存储内计算技术,提高机器学习能效

随着数据规模的迅速增长,传统计算架构因数据传输速度和处理速度不匹配,面临冯·诺依曼瓶颈的限制。为了解决这一问题,北京大学集成电路学院与人工智能研究所研究团队开发了一种双存储内计算(dual-IMC)方案。该方案显著提升了神经网络在边缘计算中的能效与性能。

研究团队设计了双存储内计算(IMC, In-Memory Computing)方案,该方案通过将神经网络的权重和输入数据同时存储在内存阵列中,完全消除了数据移动的需求,克服了传统单IMC方案中数据传输的能效瓶颈。在该方案下,矩阵-向量乘法(MVM, Matrix-Vector Multiplication)操作得以完全在内存中进行,避免了数字-模拟转换的额外开销。

研究团队还通过制造基于电阻式随机存取存储器(RRAM, Resistive Random-Access Memory)的设备,进行了信号恢复和图像处理的实验。实验表明,该方案相较于单IMC在计算延迟和能效上提高了3到4个数量级。此外,由于无需数字-模拟转换器(DAC, Digital-to-Analog Converter),该方案降低了芯片面积和生产成本。研究成果展示了双IMC技术在加速神经网络计算中的巨大潜力。研究发表在 Device 上。

#存储内计算 #机器学习 #边缘计算 #电阻式随机存取存储器

阅读更多:

Wang, Shiqing, and Zhong Sun. “Dual In-Memory Computing of Matrix-Vector Multiplication for Accelerating Neural Networks.” Device, vol. 0, no. 0, Sept. 2024. www.cell.com, https://doi.org/10.1016/j.device.2024.100546.

新的评估框架助力医疗保健领域大型语言模型的人类评估

随着生成式人工智能(GenAI)在医疗保健领域的应用不断扩展,大型语言模型(LLMs)如GPT-4和LLaMA2,已经显示出潜力,能够支持临床决策、患者教育和风险评估等多方面的医疗保健工作。然而,现有的评估方式难以全面衡量LLMs在实际医疗应用中的有效性和安全性。为了解决这一问题,研究团队对来自全球的142篇关于LLMs人类评估的研究进行了系统性综述,提出了一个名为QUEST的评估框架,以指导未来的评估工作。

研究团队首先对142篇关于LLMs在医疗保健领域的人类评估研究进行全面综述,发现目前的评估方式缺乏一致性和全面性,尤其在可靠性、普适性和实际应用方面存在明显不足。为了填补这些空白,研究团队提出了QUEST评估框架。QUEST框架涵盖三个阶段:规划、实施与裁定、评分与审查,并基于五个核心评估原则:信息质量、理解与推理、表达风格与人格、安全性与伤害、以及信任与信心。

在信息质量方面,研究团队强调了对信息准确性、相关性、完整性等维度的评估;在理解与推理方面,关注LLMs对医疗问题的理解和推理能力;表达风格与人格则涉及对LLMs回应中情感表达和交流风格的评估;安全性与伤害维度强调了对潜在错误和危害的识别;信任与信心则涉及对LLMs输出的可信度和用户满意度的评价。研究结果表明,该框架能够更系统地评估LLMs在医疗保健领域的应用,为确保LLMs在实际医疗情境中的安全性和有效性提供了坚实的指导。该研究发表在 Npj Digital Medicine 上。

#认知科学 #大型语言模型 #医疗保健 #人类评估 #信息质量

阅读更多:

Tam, Thomas Yu Chow, et al. “A Framework for Human Evaluation of Large Language Models in Healthcare Derived from Literature Review.” Npj Digital Medicine, vol. 7, no. 1, Sept. 2024, pp. 1–20. www.nature.com, https://doi.org/10.1038/s41746-024-01258-7.

多语言医学语言模型的突破:MMed-Llama 3 接近 GPT-4

近年来,大语言模型在医学领域表现出色,但大多数模型仅限于英语应用,限制了它们在全球范围内的使用。为了解决这一问题,由上海交通大学和北京协和医学院的研究团队开发了一个开源的多语言医学大语言模型,专门用于处理不同语言的医学问题。团队通过构建一个多语言医学语料库(MMedC)和问答基准(MMedBench),推动了该领域的跨语言研究。

研究团队首先收集了包含六种主要语言(英语、中文、日语、法语、俄语、西班牙语)的医学语料库(MMedC),其规模达到255亿个词元。语料库的来源包括大型多语言数据集、医学教科书和医学网站。这为训练多语言医学模型提供了坚实的基础。为了评估模型表现,研究团队还开发了多语言医学问答基准(MMedBench),该基准不仅测试模型的多项选择题答题准确率,还引入了推理能力的评估。

在测试阶段,团队评估了多个开源大语言模型,包括 GPT-3.5、GPT-4、Llama 3 等,最终发现经过 MMedC 进一步训练的 MMed-Llama 3 模型在多语言问答测试中的表现优于其他模型,接近 GPT-4 的水平。MMed-Llama 3 在测试中的多项选择题准确率达到67.75%,并且在推理能力上也表现出色。研究发表在 Nature Communications 上。

#神经技术 #多语言模型 #医学问答

阅读更多:

Qiu, Pengcheng, et al. “Towards Building Multilingual Language Model for Medicine.” Nature Communications, vol. 15, no. 1, Sept. 2024, p. 8384. www.nature.com, https://doi.org/10.1038/s41467-024-52417-z.

整理|ChatGPT

编辑|丹雀、1900、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。

TCCI建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。