█ 脑科学动态
Cell:肠道微生物如何加剧哮喘并保护肺部
全球首个多发性硬化症脑图谱助力精准治疗
酒精如何影响大脑灵活性?神经元放电模式揭示答案
超灵敏应变传感器推动中风等疾病早期诊断
掌控盐食欲的神经开关
tau 蛋白丝与细胞外囊泡的选择性包装:阿尔茨海默病的新线索
GABA和多巴胺如何协同启动食物摄入
█ AI行业动态
OpenAI发布o3与o3-mini:推理能力突破AGI基准
GPT-5开发进展缓慢,OpenAI面临巨额成本和多次失败
█ AI研发动态
定期运动让大脑更年轻:AI评估揭示健康生活的关键作用
CREW平台加速人类与AI的协作效率
人工智能系统已接近实现图灵的“模仿游戏”愿景
AI系统揭示隐藏的毒品黑话,帮助打击网络犯罪
99.56%准确率!加密技术助力AI突破医疗隐私难题
医学图像不再难懂,AI模型轻松生成答案
百万级聚合物属性一键获取,大语言模型驱动材料科学数据自动提取
脑科学动态
Cell:肠道微生物如何加剧哮喘并保护肺部免受结核侵害
肠道微生物在免疫系统中的作用越来越受到关注。多伦多大学的研究团队对肠道微生物与肺部免疫系统的关系进行了深入研究,发现一种名为肌毛滴虫(T. mu)的原生动物能够影响肺部免疫反应。该研究旨在揭示这些微生物如何通过调节免疫细胞在肠道和肺部之间的迁移,影响哮喘和结核等疾病的发生和进展。
研究人员通过观察小鼠模型,发现T. mu通过驱动肠道来源的免疫细胞ILC2(炎症性群体2固有淋巴细胞)向肺部迁移,形成一个由ILC2、T细胞和B细胞构成的免疫网络。这一网络在促进嗜酸性粒细胞的增多的同时,也加剧了过敏性哮喘的病情。然而,这一免疫变化在结核感染中则起到了保护作用,帮助控制了结核分枝杆菌的扩散。此外,研究人员还在哮喘患者的痰样本中发现了与T. mu相关的基因信息,表明这些原生动物在人体疾病中的作用。研究发表在 Cell 上。
#免疫学 #肠道微生物 #肌毛滴虫 #过敏性哮喘 #结核病
阅读论文:
Burrows, Kyle, et al. “A Gut Commensal Protozoan Determines Respiratory Disease Outcomes by Shaping Pulmonary Immunity.” Cell, vol. 0, no. 0, Dec. 2024. www.cell.com, https://doi.org/10.1016/j.cell.2024.11.020
全球首个多发性硬化症脑图谱助力精准治疗
多发性硬化症(MS)是一种慢性炎症性疾病,影响大脑和脊髓。当前的治疗方法主要集中于抑制免疫细胞,但对晚期患者的疗效有限。为了解决这一问题,卡罗林斯卡学院、爱丁堡大学和巴塞尔霍夫曼罗氏等机构的国际研究团队共同研究,利用单细胞RNA测序技术,绘制了多发性硬化症患者脑细胞基因表达的“图谱”,为个性化治疗提供了新的视角。
▷Credit: Neuron (2024).
研究人员通过单细胞RNA测序技术,分析了来自156名患者和健康对照的大脑组织样本,共计632,000个细胞核数据。结果显示,多发性硬化症患者的大脑灰质和白质存在显著的细胞类型特异性基因表达差异。研究将患者分为四个亚组,这些亚组展示了不同的病理过程,并且患者间的基因表达差异主要由个体差异引起。这一发现为基于个体病理过程的精准治疗开辟了新路径。未来的研究将通过结合患者血液和脑脊液数据,进一步推动个性化医疗的进展。研究发表在Neuron 上。
#大脑健康 #多发性硬化症 #单细胞RNA测序 #精准医学
阅读论文:
Macnair, Will, et al. “snRNA-Seq Stratifies Multiple Sclerosis Patients into Distinct White Matter Glial Responses.” Neuron, vol. 0, no. 0, Dec. 2024. www.cell.com, https://doi.org/10.1016/j.neuron.2024.11.016
酒精使用障碍(AUD)不仅影响身体健康,还显著损害大脑的认知灵活性。德克萨斯农工大学医学院的王俊团队通过光遗传学技术,深入研究了酒精暴露如何通过改变胆碱能中间神经元(CIN)的放电模式影响大脑的适应性。研究结果显示,酒精的长期使用扰乱了CIN的“爆发-暂停”放电模式,从而损害了认知灵活性,特别是影响了逆向学习的能力。
▷过量饮酒会降低 DMS CIN 中丘脑诱发的突发暂停反应,并损害操作性条件反射的逆转。Credit: Science Advances (2024).
研究团队利用光遗传学技术和光纤光度测定(fiber photometry)技术,研究了CIN在酒精暴露下的活动变化。CIN是一类重要的神经元,负责调控大脑的适应性行为,尤其是通过乙酰胆碱(ACh)信号调节学习过程。实验发现,在酒精暴露的动物模型中,CIN的“爆发-暂停”模式发生了显著改变,暂停期变短且强度减弱,导致了逆向学习等行为的障碍。通过模拟CIN爆发放电,研究人员加速了消退学习过程,而通过破坏CIN的暂停放电,则使目标导向行为更新受阻。这一发现揭示了CIN的“爆发”放电有助于消退学习,而“暂停”放电则对于逆向学习至关重要。研究结果为理解酒精使用障碍如何影响认知灵活性提供了新视角,并提出了潜在的治疗靶点。研究发表在 Science Advances 上。
#神经技术 #酒精使用障碍 #认知灵活性 #光遗传学
阅读论文:
Huang, Zhenbo, et al. “Dynamic Responses of Striatal Cholinergic Interneurons Control Behavioral Flexibility.” Science Advances, vol. 10, no. 51, Dec. 2024, p. eadn2446. science.org (Atypon), https://doi.org/10.1126/sciadv.adn2446
超灵敏应变传感器推动中风等疾病早期诊断
随着精准生物医学工程的发展,如何实时监测微小的生物力学信号成为一个关键挑战。首尔国立大学材料科学与工程系的Seung-Kyun Kang教授领导的研究小组,与檀国大学、亚洲大学和普渡大学的研究人员合作,开发了一种新型超灵敏、可拉伸的应变传感器,旨在通过微裂纹与元结构的结合,检测极其微小的变形,从而为疾病的早期诊断开辟新天地。
这项研究介绍了通过创新的“元裂纹”传感器检测极小应变(如10−5应变),比传统传感器的灵敏度高出1000倍。该传感器通过控制微裂纹的扩展,放大电阻变化,使其能够检测到极为细微的变形。这项技术可以实时监测血流变化,有助于早期诊断脑血管疾病,如脑出血和缺血等。此外,研究团队还成功将该传感器应用于监测脑血管表面,进行实时血流监测,展示了其在生物医学领域的巨大潜力。值得一提的是,传感器使用的材料是可生物降解的,避免了体内的长期残留,确保了患者的安全。这项研究在 Science Advances 上发表,展示了超灵敏传感器在精准医疗中的应用前景。
#生物医学工程 #中风诊断 #超灵敏传感器 #应变传感器
阅读论文:
Lee, Jae-Hwan, et al. “Hypersensitive Meta-Crack Strain Sensor for Real-Time Biomedical Monitoring.” Science Advances, vol. 10, no. 51, Dec. 2024, p. eads9258. science.org (Atypon), https://doi.org/10.1126/sciadv.ads9258
掌控盐食欲的神经开关
盐对人体至关重要,但过多或过少的盐都会引发健康问题。爱荷华大学的研究人员乔尔·吉尔林和西尔维亚·加斯帕里尼,通过对小鼠和人类的研究,首次揭示了调节盐食欲的神经回路,发现醛固酮通过激活HSD2神经元(脑干中的一小群神经元)来控制盐的摄入。
研究团队使用小鼠实验验证,钠摄入不足会导致醛固酮水平上升,同时激活HSD2神经元,增加盐的摄入量。进一步的研究发现,HSD2神经元是醛固酮驱动盐摄入所必需的。研究人员通过基因靶向去除这些神经元,证明它们在盐食欲中的关键作用。此外,研究还发现,人类脑干中也存在这一群体的神经元,提示这一神经回路在不同物种间有着显著的相似性。该研究为理解盐食欲背后的神经机制以及未来可能的治疗方案提供了新的线索。研究发表在 JCI Insight 上。
#神经科学 #盐食欲 #醛固酮 #HSD2神经元
阅读论文:
Gasparini, Silvia, et al. “Aldosterone-Induced Salt Appetite Requires HSD2 Neurons.” JCI Insight, vol. 9, no. 23, Dec. 2024. insight.jci.org, https://doi.org/10.1172/jci.insight.175087
tau 蛋白丝与细胞外囊泡的选择性包装:阿尔茨海默病的新线索
阿尔茨海默病(AD)是一种常见的神经退行性疾病,tau 蛋白的异常聚集被认为是疾病的重要标志。虽然已有研究发现 tau 蛋白与细胞外囊泡(EV)之间存在某种关联,但具体机制仍不明确。为进一步探索 tau 蛋白与 EV 的关系,来自英国伦敦大学学院痴呆症研究所、医学研究委员会分子生物学实验室等机构的研究团队,结合定量质谱、冷冻电镜断层扫描和单颗粒冷冻电镜等技术,分析了来自 AD 患者大脑的 EV,揭示了 tau 蛋白丝在 EV 中的选择性包装现象。
▷AD 患者大脑中 EV 衍生的 tau PHF 的冷冻电镜结构。Credit: Nature Neuroscience (2024).
研究人员首先采用定量质谱对来自 AD 患者大脑的 EV 进行了深入分析,发现 EV 中的 tau 蛋白丝主要由截短的 tau 蛋白组成。此外,使用冷冻电镜断层扫描和单颗粒冷冻电镜技术,进一步揭示了这些 tau 蛋白丝被包裹在富含内溶酶体蛋白的 EV 中。研究还观察到,tau 蛋白丝通过特定分子与 EV 的膜发生多重相互作用,提示 tau 蛋白丝在 EV 内部是通过选择性包装的方式与 EV 膜连接。这一发现为 tau 蛋白与 EV 之间的相互作用提供了新的认识,并为今后研究 tau 蛋白在神经退行性疾病中的作用提供了新的视角,特别是在开发新的治疗策略时,可能通过靶向 EV 相关的 tau 蛋白来减缓 AD 的进展。研究结果发表在 Nature Neuroscience 上。
#大脑健康 #阿尔茨海默病 #tau 蛋白 #细胞外囊泡
阅读论文:
Fowler, Stephanie L., et al. “Tau Filaments Are Tethered within Brain Extracellular Vesicles in Alzheimer’s Disease.” Nature Neuroscience, Nov. 2024, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-024-01801-5
GABA和多巴胺如何协同启动食物摄入
大脑如何调节食物摄入的开始一直是科学研究的难题。贝勒医学院与德克萨斯大学休斯顿健康科学中心的研究人员,使用动物模型和一系列神经技术,揭示了血清素在调节进餐启动中的作用,并发现GABA和多巴胺在这一过程中起到关键作用。
▷Credit: Metabolism (2024).
研究团队通过光遗传学、电子生理学以及通道视紫红质-2辅助的回路映射技术,深入研究了5-HT DRN神经元在进餐启动中的作用。研究发现,这些神经元通过其与弓状核(ARH)回路的连接,调节了进餐的开始。当动物处于饥饿状态时,GABA和多巴胺通过协同作用抑制5-HT DRN神经元的活动,降低大脑中的血清素水平,从而启动进餐行为。随着动物进食并感到饱足,抑制信号减弱,血清素水平恢复正常,进一步抑制进食行为。此外,删除5-HT神经元中的GABAA受体亚单位可以阻止进餐启动,而不影响饱腹感的产生。这些发现为我们理解大脑如何管理体重和食物摄入提供了新的线索,并为改善肥胖治疗药物的设计提供了理论基础。
#神经技术 #进餐启动 #GABA #多巴胺
阅读论文:
Conde, Kristine M., et al. “Serotonin Neurons Integrate GABA and Dopamine Inputs to Regulate Meal Initiation.” Metabolism - Clinical and Experimental, vol. 163, Feb. 2025. www.metabolismjournal.com, https://doi.org/10.1016/j.metabol.2024.156099
AI 行业动态
OpenAI发布o3与o3-mini:推理能力突破AGI基准,但高计算成本仍是挑战
OpenAI在其为期12天的发布活动中迎来了重磅更新——推出了全新的o3和o3-mini模型,标志着推理能力的重大突破。作为o1系列的继任者,o3和o3-mini将AI推理提升到了前所未有的高度。o3系列模型能够突破ARC-AGI基准(一个用于评估AI在推理和适应新任务上的能力的标准),首次在这一基准上取得了优良成绩,最低得分为75.7%,在高计算模式下甚至可达到87.5%的水平。尽管如此,o3系列每次任务的计算成本极高,特别是在高效模式下,每个任务的费用可能达到数千美元。
在安全测试阶段,o3系列并不会立即公开,而是将在2025年1月正式发布前进行外部安全测试。开发者和研究人员可通过OpenAI网站申请参与,帮助评估模型的能力并为安全性提供反馈。此外,o3-mini版本则在成本和性能之间找到平衡,提供不同推理时间的选择,尤其适合用于编程任务。
OpenAI研究人员表示,尽管o3在多个基准测试中展现出强大的推理和编码能力,但它仍与人类智能存在差距,无法完全胜任某些任务。尽管如此,o3系列的表现已经接近人类在某些领域的推理水平,为人工智能发展迈出了重要一步。
#OpenAI #o3 #AGI #人工智能 #推理突破
阅读更多:
https://openai.com/index/deliberative-alignment/
GPT-5开发进展缓慢,OpenAI面临巨额成本和多次失败
近期,关于 OpenAI 最新一代语言模型GPT-5的消息引起了广泛关注。尽管OpenAI已进行了至少两轮为期数月的训练,但每次训练后均面临不同的新问题。为了满足GPT-5的庞大预训练需求,OpenAI不得不雇佣专业人员从头构建数据,使用合成数据的方式,但这一进展远低于预期。
根据《华尔街日报》报道,GPT-5的训练成本极为高昂,每轮训练的算力费用约为5亿美元。而为了让模型在科学发现和日常任务中表现更加精准,OpenAI还计划将GPT-5的智能水平提升至博士生水平,能深入理解和推理特定领域的问题。尽管如此,GPT-5的推出时间仍未确定,预计可能推迟至2025年或2026年。
OpenAI的前CTO Mira曾形容GPT-5具备博士生的智能水平,希望它能够在减少错误和解决复杂问题上达到更高标准。然而,由于数据资源的消耗殆尽,OpenAI不得不依靠外部专家来帮助构建相关数据。此外,OpenAI还试图利用AI合成数据提升训练效率,但合成数据的质量仍有待提高。
与此同时,OpenAI的其他模型,如o3系列,也在不断取得突破,并刷新了多个测试成绩。尽管如此,GPT-5的开发过程依然面临着技术难题和巨额成本的挑战,这使得它的发布变得不确定。
# OpenAI # 训练成本 # 数据构建 # AI合成数据
阅读更多:
https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi
AI 驱动科学
定期运动让大脑更年轻:AI评估揭示健康生活的关键作用
衰老是人类无法避免的过程,但不同人的大脑衰老速度差异却受多种因素影响。卡罗林斯卡学院的研究团队使用人工智能工具分析了739名70岁认知健康老人的大脑图像,估算了他们的大脑生物学年龄,并探索生活方式和健康因素对大脑衰老的影响。研究发现,健康的生活习惯有助于保持年轻的大脑,而不良的生活方式则可能加速大脑衰老。
研究团队通过AI算法计算了“大脑年龄差距”(BAG),即参与者的实际年龄与预测大脑年龄之间的差距。结果显示,缺乏运动、糖尿病和中风等因素与“大脑年龄”较大(即大脑看起来较老)相关,而健康生活方式、包括定期运动,与“大脑年龄”较小(即大脑看起来较年轻)相关。此外,研究还发现,体力活动可以减轻肥胖对大脑衰老的影响。更高的脑小血管病负担、白质改变、高血糖和炎症等与“大脑年龄”较大密切相关。同时,男女在BAG相关因素上有所不同,女性和男性的大脑衰老机制可能存在差异。研究发表在 Alzheimer’s & Dementia: The Journal of the Alzheimer’s Association 上。
#大脑健康 #人工智能 #大脑年龄 #健康生活方式
阅读更多:
Marseglia, Anna, et al. “Biological Brain Age and Resilience in Cognitively Unimpaired 70-Year-Old Individuals.” Alzheimer’s & Dementia, vol. n/a, no. n/a. Wiley Online Library, https://doi.org/10.1002/alz.14435. Accessed 23 Dec. 2024
CREW平台加速人类与AI的协作效率
随着机器学习的快速进展,人类与AI的协作潜力日益增强,成为提升团队表现的重要途径。尽管已有众多关于人类协作(如认知科学、神经科学、心理学等领域)和AI多代理学习的研究,但缺乏一个全面统一的平台来促进跨学科的合作与假设验证。为了解决这一问题,杜克大学的研究团队开发了CREW平台,旨在支持多任务的实时人类与AI协作研究,并通过模块化设计增强平台的可扩展性和适应性。
CREW平台设计注重多学科协作,支持各种任务并允许轻松扩展,能够应对不同复杂度的任务。平台的核心创新之一是实时反馈机制,允许人类与AI之间的互动不再局限于传统的离线反馈。平台支持通过多种生理信号(如眼动、心率、大脑活动等)记录人类的反馈,帮助AI更精准地进行学习。研究中,CREW成功地对50名参与者进行了实验,验证了人类反馈对强化学习(RL)算法的指导作用。此外,CREW还整合了认知测试,研究表明,个体的认知差异(如空间推理和决策速度)会显著影响与AI的协作效率。
CREW平台的一个亮点是其开放源代码的设计,促进全球范围内的协作研究。这为跨学科研究提供了基础设施,能够推动人类与AI协作研究的可重复性和可扩展性。研究人员使用CREW对实时人类引导的强化学习算法进行了基准测试,并与现有的RL算法进行了比较,证明了平台在提升AI学习效率和优化协作过程中的潜力。这一研究成果为人类与AI的合作奠定了更加坚实的理论和实验基础。研究发表在 Transactions on Machine Learning Research 上。
#认知科学 #人类与AI协作 #实时反馈 #开放源代码
阅读更多:
https://openreview.net/pdf?id=ZRXwHRXm8i
人工智能系统已接近实现图灵的“模仿游戏”愿景
现代人工智能系统已达成艾伦·图灵70多年前提出的目标:机器能够通过经验学习并进行类人对话。然而,这一成就并非完全如图灵所设想的那样。Bernardo Gonçalves来自圣保罗大学和剑桥大学,指出当前AI系统的能源消耗和发展方式与图灵的预言存在差距。
贡萨尔维斯的研究着眼于现代AI系统,尤其是基于变压器(transformer)架构的生成式AI。这些系统通过“注意力机制”(attention mechanism)和大规模学习,能够模拟并完成以前只有人类才能执行的任务,如生成连贯文本、解决复杂问题和讨论抽象概念。它们通过不断学习和积累经验来提高智能,表现在与人类的对话中,能够以类人的方式进行互动,从而通过了图灵测试。这一发展标志着图灵设想的“模仿游戏”概念的实现。
然而,Gonçalves也指出,当前的AI系统在能源消耗方面远超图灵的预期,而图灵所设想的“儿童机器”应当能够像人类儿童一样自然发展,具有更低的能耗。此外,现代AI的发展也带来了一系列社会问题,如失业和社会不平等。因此,贡萨尔维斯建议,未来的AI测试需要更加严格,采用机器对手和统计协议等方法,确保系统能够在现实世界的复杂环境中进行有效评估。研究发表在 Intelligent Computing 上。
#认知科学 #图灵测试 #生成式AI #能源消耗
阅读更多:
Gonçalves, Bernardo. “Passed the Turing Test: Living in Turing Futures.” Intelligent Computing, Nov. 2024. world, spj.science.org, https://doi.org/10.34133/icomputing.0102
AI系统揭示隐藏的毒品黑话,帮助打击网络犯罪
社交媒体上毒品交易的日益猖獗已经成为了社会问题。为了逃避执法机构的监控,犯罪分子开始使用“黑话”——即由常见词汇组合成的隐蔽术语,难以被自动化监控系统识别。电力通信大学(UEC)研究团队,包含Takuro Hada、Yuichi Sei、Yasuyuki Tahara和Akihiko Ohsuga,提出了一种基于人工智能(AI)技术的方法,能够通过分析社交媒体上的词汇关系,更准确地识别这些难以捉摸的黑话。
该研究提出了一种创新的AI方法,通过分析社交媒体帖子中的单词对关系,识别复合型黑话。传统的文本分析工具通常将句子拆解成单个词汇,忽略了多个词汇组合而成的复合术语,这导致了许多非法术语无法被及时发现。新方法通过检测单词对的组合,成功解决了这一问题,能够识别出新的、具有刑事意图的术语。实验结果显示,该系统在准确性上提高了7%,并且成功识别出10个现有方法无法检测的复合型黑话。与七名资深警察的访谈表明,93.2%的新发现的术语是他们从未接触过的。这项研究为打击网络犯罪提供了强有力的支持,不仅能够帮助执法机关提升监控效率,也有助于社交媒体平台增强内容审核能力。研究发表在 Journal of Information Processing 上。
#认知科学 #黑话 #人工智能 #社交媒体监控
阅读更多:
https://www.scitepress.org/Papers/2023/119188/119188.pdf
99.56%准确率!加密技术助力AI突破医疗隐私难题
随着人工智能在医疗领域应用的不断拓展,如何在确保数据隐私的前提下使用人工智能分析患者数据成为了一个重要问题。布法罗大学的研究团队通过创新性的方法,提出了一种新的解决方案,采用完全同态加密(FHE)技术来保护医疗数据的隐私。
▷隐私保护睡眠呼吸暂停检测器的框架。Credit: University at Buffalo
该研究的核心创新在于使用完全同态加密(FHE)技术保护从云平台传输的心电图(ECG)数据,确保患者隐私不被泄露。FHE技术能够在不解密数据的情况下,允许对加密数据进行深度学习计算。为了应对加密数据在深度学习中处理效率低下的问题,研究团队开发了多种优化技术,涵盖了卷积层、池化层、激活函数和全连接层等深度学习网络中的关键部分。通过这些创新,研究人员成功提高了处理加密数据的速度和效率。实验结果显示,采用该方法在加密的心电图数据上进行睡眠呼吸暂停的诊断时,准确率达到了99.56%,几乎与传统的未加密数据相当。该方法的成功不仅能加速睡眠呼吸暂停的诊断和治疗,也为其他医疗数据处理提供了更安全的解决方案。研究发表在国际模式识别会议(ICPR 2024)上。
#神经技术 #人工智能 #医疗数据隐私 #完全同态加密
阅读更多:
https://drive.google.com/file/d/1XL5XDmDPtSqtlm0CBz8kBJb_zVJ5eXYH/view
医学图像不再难懂,AI模型轻松生成答案
医学图像在医疗中的重要性不言而喻,但如何准确解读这些图像仍然是一项挑战。为了推动医学视觉问答(MedVQA)系统的发展,来自Xiaoman Zhang、Chaoyi Wu、Ziheng Zhao、Weixiong Lin、Ya Zhang、Yanfeng Wang和Weidi Xie的团队开发了一个新的生成型模型,并构建了一个名为PMC-VQA的大规模医学图像问答数据集。该模型通过结合视觉信息和语言模型,能够更灵活地回答关于医学图像的问题。
研究团队首先构建了PMC-VQA数据集,包含227,000个问题-答案对,涵盖149,000张医学图像。该数据集包含80%的放射学图像,涉及多种医学成像模式和疾病。研究人员设计了一种生成型模型MedVInT,能够生成自由形式的答案,而非传统的选项式回答。通过在PMC-VQA数据集上的训练以及在公开基准数据集上的微调,MedVInT在多项选择任务中的准确率超过了80%。与现有模型相比,MedVInT在解答医学图像相关问题时表现出更高的准确性和灵活性。研究还提出了一个更加具有挑战性的测试集,以推动该领域的发展。该研究为医学图像问答系统的未来研究提供了新的方向。研究发表在 Communications Medicine 上。
#神经技术 #医学图像 #生成型模型 #医学视觉问答
阅读更多:
Zhang, Xiaoman, et al. “Development of a Large-Scale Medical Visual Question-Answering Dataset.” Communications Medicine, vol. 4, no. 1, Dec. 2024, pp. 1–13. www.nature.com, https://doi.org/10.1038/s43856-024-00709-2
百万级聚合物属性一键获取,大语言模型驱动材料科学数据自动提取
材料科学领域面临着大量数据分散在文献中的问题,尤其是聚合物领域的属性数据。Sonakshi Gupta、Akhlak Mahmood、Pranav Shetty、Aishat Adeboye 和 Rampi Ramprasad 组成的研究团队,结合了GPT-3.5、LlaMa 2等大语言模型(LLM)与MaterialsBERT(基于命名实体识别的模型),提出了一种自动提取聚合物属性数据的新框架,成功从240万篇期刊全文中提取了大量聚合物数据。
研究团队首先筛选出681,000篇与聚合物相关的文章,并通过一套双阶段过滤机制(包括启发式过滤和NER过滤)识别出最相关的段落。然后,他们利用MaterialsBERT和GPT-3.5模型分别提取聚合物的24种属性数据,最终从这些文章中提取了超过100万个聚合物属性记录。研究团队还评估了使用这些模型进行数据提取的性能,并对比了它们与传统NER模型的优缺点。结果显示,大语言模型在数据提取中具有显著的优势,尤其是在节省成本和提高效率方面。为支持后续研究,所有提取的数据已通过Polymer Scholar网站公开。研究还提出了一些优化方法,特别是在推理时利用少样本学习来降低成本并提高效率。研究发表在 Communications Materials 上。
#神经技术 #大语言模型 #材料数据提取 #聚合物 #数据自动化
阅读更多:
Gupta, Sonakshi, et al. “Data Extraction from Polymer Literature Using Large Language Models.” Communications Materials, vol. 5, no. 1, Dec. 2024, pp. 1–11. www.nature.com, https://doi.org/10.1038/s43246-024-00708-9
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。
热门跟贴