脑科学动态

Science:免疫系统的“记忆”帮助诊断复杂疾病

气味词典:气味感知的标准化语言系统

细胞通透肽:神经再生的新钥匙

1N4R tau 异构体:阿尔茨海默病神经毒性的“罪魁祸首”

血液中的“隐形杀手”,这些代谢物可能影响孩子发育

唐氏综合症患者认知稳定性挑战阿尔茨海默病的假设

三联免疫疗法在脑癌治疗中展现潜力

AI行业动态

南京大学周志华团队斩获AAAI 2025杰出论文奖

DeepSeekV3/R1,日赚56万美元,成本利润率高达545%

瑞金医院与华为联手推出瑞智病理大模型RuiPath

AI驱动科学

DNA存储技术大突破:速度提升3200倍,准确率提高40%

e-Taste设备让你在VR中“品尝”美食

MindLLM 将脑活动直接转化为文字

Lottery LLM假设:探索大模型压缩中的关键能力

个性化AI教练显著提高戒烟成功率

每日一赛:AI模型优化数据中心

AI也会“想太多”?减少过度思考让计算成本直降43%

HippoRAG 2框架突破大语言模型持续学习瓶颈

脑科学动态

Science:免疫系统的“记忆”帮助诊断复杂疾病

免疫系统通过B细胞和T细胞的受体记录了过去的病原体信息,这些信息可以用于疾病诊断。斯坦福大学的研究团队开发了名为Mal-ID的机器学习算法,通过分析这些受体序列来诊断复杂疾病。

免疫细胞(顶部)通过重组 DNA 片段(第二幅图)产生高度可变的受体,以识别细菌等威胁(第三幅图中的绿色)。识别“成功”受体(第四幅图)有助于诊断复杂疾病。Credit: Emily Moskal/Stanford University

研究团队收集了近600人的B细胞和T细胞受体序列,使用机器学习技术分析这些序列,以识别不同疾病状态。Mal-ID算法通过分析B细胞受体(BCR)和T细胞受体(TCR)的序列,能够准确识别包括COVID-19、狼疮和1型糖尿病在内的多种疾病。研究结果显示,结合B细胞和T细胞数据能显著提高诊断准确性,特别是在区分狼疮患者时,Mal-ID表现出93%的灵敏度和90%的特异性。研究发表在 Science 上。

#神经技术 #个性化医疗 #免疫诊断 #机器学习 #疾病预防

阅读更多:

Zaslavsky, Maxim E., et al. “Disease Diagnostics Using Machine Learning of B Cell and T Cell Receptor Sequences.” Science, vol. 387, no. 6736, Feb. 2025, p. eadp2407. science.org (Atypon), https://doi.org/10.1126/science.adp2407

气味词典:气味感知的标准化语言系统

耶拿弗里德里希席勒大学的Antonie Bierling和Alexander Croy等研究人员,为了解决人类对气味感知的复杂性问题,与德累斯顿工业大学的同事合作,创建了一个基础气味数据库。他们让1,200多名测试对象闻了74个单分子气味样本,并记录了他们如何描述和评估这些气味。研究结果通过一款应用程序向公众开放。

研究人员通过让1,227名年轻人描述和评估74种化学结构多样的单分子气味(mono-molecular odorants),收集了自由描述、评价评分和定性标签的数据。这些数据为理解嗅觉感知的基础提供了宝贵的基础。此外,他们还与芬兰、以色列和捷克共和国的研究人员合作,开发了一个记录体味的数据集,名为SMELLODI项目,旨在通过详细记录体味来帮助识别和诊断疾病。研究发表在 Scientific Data 上。

#认知科学 #个性化医疗 #电子鼻 #气味感知 #体味诊断

阅读更多:

Bierling, Antonie L., et al. “A Standardized Lexicon of Body Odor Words Crafted from 17 Countries.” Scientific Data, vol. 12, no. 1, Feb. 2025, p. 325. www.nature.com, https://doi.org/10.1038/s41597-025-04630-8

Bierling, Antonie Louise, et al. “A Dataset of Laymen Olfactory Perception for 74 Mono-Molecular Odors.” Scientific Data, vol. 12, no. 1, Feb. 2025, p. 347. www.nature.com, https://doi.org/10.1038/s41597-025-04644-2

细胞通透肽:神经再生的新钥匙

每年,数百万美国人因脊髓损伤、脑外伤及神经退行性疾病(如阿尔茨海默病、帕金森病等)而遭受神经功能损害。罗格斯大学纽瓦克分校的 Pabitra Sahoo 及其团队开发了一种细胞通透肽(cell-permeable peptide),通过溶解神经轴突中的应激颗粒(stress granules),成功促进了周围神经系统(PNS)和中枢神经系统(CNS)的轴突再生。

G3BP1 酸性域在中枢神经元中的表达促进轴突再生。Credit: Proceedings of the National Academy of Sciences (2025).

研究团队发现,G3BP1 蛋白在中枢神经系统轴突中形成应激颗粒,抑制轴突再生。通过设计一种源自 G3BP1 的细胞通透肽,团队成功分解了这些颗粒,从而加速了轴突再生。实验表明,该肽在坐骨神经损伤、脊髓横断和视神经损伤中均有效。此外,该肽还能促进实验室培养的人类神经元的轴突生长,并增加皮质神经元中的蛋白质合成。这些结果表明,G3BP1 颗粒是轴突再生的关键障碍,其分解可能成为治疗神经损伤的新策略。研究发表在 PNAS 上。

#神经科学 #个性化医疗 #神经再生 #细胞通透肽 #G3BP1

阅读更多:

Sahoo, Pabitra K., et al. “Disruption of G3BP1 Granules Promotes Mammalian CNS and PNS Axon Regeneration.” Proceedings of the National Academy of Sciences, vol. 122, no. 9, Mar. 2025, p. e2411811122. pnas.org (Atypon), https://doi.org/10.1073/pnas.2411811122

1N4R tau 异构体:阿尔茨海默病神经毒性的“罪魁祸首”

阿尔茨海默病(AD)是一种由 tau 蛋白异常聚集引发的神经退行性疾病,但其具体机制尚不明确。科隆大学和科隆大学医院的 Hans Zempel 和 Sarah Buchholz 团队利用 CRISPR/Cas9 基因编辑技术和诱导多能干细胞(iPSCs)模型,揭示了 tau 蛋白的 1N4R 异构体在 AD 中的关键作用。研究发现,1N4R tau 是淀粉样β寡聚体(AβO)诱导的神经毒性的主要介质,为 AD 治疗提供了新的方向。

tau 的敲除导致神经突生长和轴突初始段形成轻微缺陷,但不影响神经元活动。 Credit: Alzheimer's & Dementia (2025).

研究团队通过 CRISPR/Cas9 技术敲除人类 iPSCs 中的 MAPT 基因(编码 tau 蛋白),并将其分化为谷氨酸能神经元。利用组学分析、活细胞成像和亚细胞区室分析,研究人员发现 tau 敲除的神经元在神经突生长和轴突初始段形成方面存在轻微缺陷,但对 AβO 诱导的神经元活动减少具有抵抗力。重新引入 1N4R tau 异构体后,神经元恢复了对 AβO 的敏感性,并增加了 tau 的磷酸化水平,但未改变神经元活动或微管修饰。这表明 1N4R tau 是 AβO 诱导的神经毒性的关键介质,可能成为 AD 治疗的新靶点。研究发表在 Alzheimer's & Dementia 上。

#大脑健康 #疾病预防 #tau蛋白 #CRISPR/Cas9 #诱导多能干细胞

阅读更多:

Buchholz, Sarah, et al. The Tau Isoform 1N4R Confers Vulnerability of MAPT Knockout Human iPSC‐derived Neurons to Amyloid Beta and Phosphorylated Tau‐induced Neuronal Dysfunction. alz-journals.onlinelibrary.wiley.com, https://doi.org/10.1002/alz.14403. Accessed 3 Mar. 2025

血液中的“隐形杀手”,这些代谢物可能影响孩子发育

儿童早期发育与认知能力的发展受多种因素影响,但血液代谢物在这一过程中的作用尚未被充分研究。麦马斯特大学的研究团队与巴西科学家合作,基于巴西国家儿童营养调查,对5000多名6个月至5岁儿童的血液样本进行了非靶向代谢组学分析(untargeted metabolomics),揭示了代谢物与儿童发育之间的复杂关系。

儿童血清代谢组与早期儿童发展关联的有向无环图(DAG)。Credit: eLife (2025).

研究团队使用非靶向代谢组学技术分析了5004名儿童的血清样本,并结合《儿童福祉调查里程碑问卷》评估儿童早期发展(ECD)。通过分级响应模型计算发育商数(DQ),研究人员发现28种代谢物与DQ显著相关。其中,对甲酚硫酸盐(β=–0.07)、对羟基苯甲酸(β=–0.06)、苯乙酰谷氨酰胺(β=–0.06)和三甲胺-N-氧化物(β=–0.05)与DQ呈负相关,表明这些代谢物可能抑制儿童发育。此外,肌酐和甲基组氨酸与DQ的关联方向因儿童年龄而异,提示代谢物对发育的影响可能随年龄变化。这些发现表明,血清代谢物可能成为追踪儿童发育迟缓风险的重要生物标志物,并为早期干预提供了科学依据。研究发表在 eLife 上。

#大脑健康 #个性化医疗 #代谢组学 #儿童发育 #肠道-大脑轴

阅读更多:

Padilha, Marina, et al. “Serum Metabolome Indicators of Early Childhood Development in the Brazilian National Survey on Child Nutrition (ENANI-2019).” eLife, edited by Moussa Zouache et al., vol. 14, Jan. 2025, p. e97982. eLife, https://doi.org/10.7554/eLife.97982

唐氏综合症患者认知稳定性挑战阿尔茨海默病的假设

唐氏综合症(DS)患者在衰老过程中发展为阿尔茨海默病(AD)引起的痴呆的风险超过 90%。匹兹堡大学斯旺森工程学院的研究团队通过研究一名认知稳定的 DS 患者,试图揭示为什么一些 DS 患者会发展为痴呆而另一些则不会。研究人员包括加州大学 Irvine 分校的 Elizabeth Head 和匹兹堡大学的 Jr-Jiun Liou 等。

Credit: University of Pittsburgh

该患者参与了阿尔茨海默病生物标志物联盟—唐氏综合症研究项目(ABC-DS),并在去世后捐赠大脑。研究团队使用高分辨率 7 特斯拉 MRI 扫描仪对其大脑进行了成像。尽管该患者的大脑显示出阿尔茨海默病的神经病理学表现,但她在去世时认知状态稳定。研究人员认为这可能归因于她的高教育水平或潜在的遗传因素。神经成像显示该患者的淀粉样蛋白水平稳定但升高,tau 蛋白水平中度升高。神经病理学检查显示其中度 AD 神经病理变化,伴有 Lewy 体和脑血管病理。研究发表在 Alzheimer's & Dementia 上。

#大脑健康 #个性化医疗 #唐氏综合症 #阿尔茨海默病 #认知稳定性

阅读更多:

Liou, Jr-Jiun, et al. A Neuropathology Case Report of a Woman with Down Syndrome Who Remained Cognitively Stable: Implications for Resilience to Neuropathology. alz-journals.onlinelibrary.wiley.com, https://doi.org/10.1002/alz.14479. Accessed 3 Mar. 2025

三联免疫疗法在脑癌治疗中展现潜力

胶质母细胞瘤(GBM)是一种高度侵袭性和致命性的脑癌,平均生存期为12至18个月。悉尼大学医学肿瘤学家、澳大利亚黑色素瘤研究所医学总监Georgina Long教授领导的团队,利用免疫治疗专长和黑色素瘤研究成果,设计并实施了新辅助三联免疫疗法。

患者的 GBM 临床和分子细节及治疗方案。Credit: Nature Medicine (2025).

Georgina Long教授及其团队首次在胶质母细胞瘤中使用新辅助三联免疫疗法,包括抗程序性细胞死亡蛋白1(anti-PD-1)、抗细胞毒性T淋巴细胞蛋白4(anti-CTLA-4)和抗淋巴细胞激活基因3(anti-LAG-3)的药物组合。在手术前12天给予单剂量治疗,随后进行最大安全切除。手术切除的肿瘤显示,抗PD-1药物与肿瘤浸润淋巴细胞(TILs)结合,且TILs的浸润和激活显著增加。患者在17个月后没有明确的复发迹象。这表明,在手术前使用检查点抑制剂可能能够在GBM中激活免疫反应并诱导反应。研究发表在 Nature Medicine 上。

#大脑健康 #个性化医疗 #免疫疗法 #胶质母细胞瘤

阅读更多:

Long, Georgina V., et al. “Neoadjuvant Triplet Immune Checkpoint Blockade in Newly Diagnosed Glioblastoma.” Nature Medicine, Feb. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41591-025-03512-1

AI 行业动态

南京大学周志华团队斩获AAAI 2025杰出论文奖

AAAI 2025(国际人工智能促进协会年会)于2月25日至3月4日在美国费城举行,作为人工智能领域的顶级学术会议,本届会议共收到12957篇投稿,录用3032篇,录取率为23.4%。其中,南京大学周志华(Zhi-Hua Zhou)团队凭借论文《Efficient Rectification of Neuro-Symbolic Reasoning Inconsistencies by Abductive Reflection》荣获杰出论文奖。该论文提出了一种基于溯因反射(ABL-Refl)的神经符号(Neuro-Symbolic, NeSy)AI系统改进方法,通过引入领域知识,有效纠正神经网络输出中的错误,显著提升了系统的准确性和效率。

此外,多伦多大学和波尔多大学的研究者也分别凭借在智能体匹配和部分可观测马尔可夫决策过程(POMDPs)领域的研究成果获得杰出论文奖。特别值得一提的是,AAAI 2025还颁发了“AI对社会影响特别奖”,获奖论文探讨了利用志愿者收集的生物多样性数据集监测气候变化的挑战与机遇。

#AAAI2025 #神经符号AI #溯因反射 #POMDPs #生物多样性

阅读更多:

https://aihub.org/2025/03/01/congratulations-to-the-aaai2025-outstanding-paper-award-winners/

DeepSeek揭秘V3/R1推理系统:日赚56万美元,成本利润率高达545%

DeepSeek近日在其开源周的第六天,意外公布了其V3/R1推理系统的详细信息,揭示了其盈利能力。根据官方数据,如果所有token按照R1定价计算,DeepSeek理论上每日可收入56.2万美元,成本利润率高达545%。然而,实际收入远低于此,主要由于V3定价较低、部分服务免费以及夜间折扣等因素。

V3/R1推理系统通过跨节点专家并行(EP,Expert Parallelism)策略,优化了吞吐量和延迟。EP通过扩展batch大小、减少内存访问需求以及实现计算-通信重叠,显著提升了系统性能。此外,DeepSeek还采用了负载平衡机制,确保所有GPU的计算和通信负载均衡,避免性能瓶颈。

系统在预填充和解码阶段采用了不同程度的并行性,并通过“dual-batch”重叠策略隐藏通信成本,进一步提升吞吐量。DeepSeek的在线服务统计显示,每个H800节点在预填充期间平均吞吐量为73.7k tokens/s,解码期间为14.8k tokens/s。尽管系统性能卓越,DeepSeek强调其开源和透明化的初衷,旨在为社区提供价值,并推动AGI(通用人工智能)的发展。

#DeepSeek #推理系统 #成本利润率 #专家并行 #负载平衡

阅读更多:

https://github.com/deepseek-ai/open-infra-index/blob/main/202502OpenSourceWeek/

瑞金医院与华为联手推出瑞智病理大模型RuiPath

瑞金医院与华为在2025医疗人工智能与精准诊疗发展论坛上共同发布了瑞智病理大模型RuiPath。这一模型基于瑞金医院数字化智慧病理科的全业务流程开发,旨在通过数字化和AI技术实现多模态融合,提升癌症诊断的精准度和效率。RuiPath覆盖了中国90%的常见癌种,包括一些罕见病,如垂体神经内分泌肿瘤。医生可以与RuiPath进行互动式病理诊断对话,显著提高了诊断效率和质量。

瑞金医院拥有全国领先的高质量医疗数据,自2021年开始建设数字化智慧病理科,2023年发布了中国首本《数字化智慧病理科建设白皮书》。RuiPath大模型的数据模态丰富,涵盖图像、文本等多领域,数据维度广泛,基于多学科,全面反映疾病特征。数据标签完备,利于精准模型训练。RuiPath实现了四大创新,包括场景与应用创新、模型与算法创新、存算协同创新和AI工具链创新。

瑞金医院病理科主任王朝夫指出,RuiPath能够提前精准识别病灶区域,单切片AI诊断时间仅需数秒,显著提升了诊断效率与质量。华为公司副总裁周跃峰表示,华为DCS AI解决方案致力于扫清大模型在行业落地的障碍,支持数据工程工具化,显著提升行业专家模型的训练、推理及精调过程的效率,有效降低部署成本,加速AI在千行万业落地。

#瑞金医院 #华为 #RuiPath #病理大模型 #癌症诊断

阅读更多:

https://mp.weixin.qq.com/s/oMgAZ8SG2BQx4lQ-yCATuA

AI 驱动科学

DNA存储技术大突破:速度提升3200倍,准确率提高40%

随着数据量爆炸式增长,传统存储技术面临瓶颈,DNA存储技术因其高密度和低能耗成为潜在解决方案。以色列理工学院的研究团队开发了一种名为DNAformer的创新方法,结合深度神经网络、纠错码(ECC)和安全边际机制,显著提升了DNA存储系统的效率和准确性。

DNA 信息检索的端到端解决方案。Credit:Nature Machine Intelligence(2025)

DNAformer采用模块化编码方案,将深度神经网络与动态规划算法结合,优化了信息检索流程。研究团队使用Illumina miSeq和Oxford Nanopore MinION两种测序技术对3.1 MB数据进行了实验验证。结果显示,DNAformer在速度上比现有方案快3200倍,准确率提高40%,在高噪声环境下实现了每碱基1.6比特的编码率。Illumina数据集的失败率仅为0.0055%,Nanopore数据集为1.65%。这一突破为DNA存储技术的商业化应用扫除了重要障碍。研究发表在 Nature Machine Intelligence 上。

#神经技术 #自动化科研 #DNA存储 #深度神经网络 #纠错码

阅读更多:

Bar-Lev, Daniella, et al. “Scalable and Robust DNA-Based Storage via Coding Theory and Deep Learning.” Nature Machine Intelligence, Feb. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s42256-025-01003-z

e-Taste设备让你在VR中“品尝”美食

虚拟现实和增强现实技术在视觉和听觉方面取得了显著进展,但在味觉等化学感官领域的应用仍较为有限。为了填补这一空白,俄亥俄州立大学的Jinhua Li及其团队开发了一种名为“e-Taste”的新型设备,旨在通过远程感知和复制味觉来增强虚拟现实体验。该设备结合了传感器和无线化学释放器,能够识别代表五种基本味觉(甜、酸、咸、苦、鲜)的化学分子,并通过电信号将数据传输到远程设备进行复制。

e-Taste设备的核心是一个由两部分组成的执行器,包括与口腔接口和一个小型电磁泵。电磁泵连接到一种化学液体通道,当有电荷通过时,通道会振动,推动溶液通过一种特殊凝胶层进入受试者的口腔。根据溶液与凝胶层交互的时间长短,可以调整味道的强度和持续时间。研究团队通过实地测试证实,该设备能够数字模拟多种味觉强度,用户能够以约70%的准确率区分不同酸度强度。此外,设备还展示了远程味觉传输的能力,例如从加利福尼亚远程启动俄亥俄州的味觉体验。研究结果发表在 Science Advances 上。

#认知科学 #脑机接口 #虚拟现实 #味觉感知 #e-Taste

阅读更多:

Chen, Shulin, et al. “A Sensor-Actuator–Coupled Gustatory Interface Chemically Connecting Virtual and Real Environments for Remote Tasting.” Science Advances, vol. 11, no. 9, Feb. 2025, p. eadr4797. science.org (Atypon), https://doi.org/10.1126/sciadv.adr4797

MindLLM 将脑活动直接转化为文字

将大脑活动解码为自然语言是神经科学和脑机接口领域的重要挑战,但现有方法在预测性能、任务多样性和跨个体泛化能力上存在局限。耶鲁大学、达特茅斯学院和剑桥大学的研究人员开发了 MindLLM,这是一种不针对特定个体的模型,可以将功能性磁共振成像信号解码为文本。通过结合神经科学启发的注意力机制和大型语言模型,研究团队成功提升了模型的性能、泛化能力和适应性。

方法概述。Credit: arXiv (2025).

MindLLM 的核心包括一个 fMRI 编码器和一个现成的大型语言模型。fMRI 编码器采用了一种基于神经科学的注意力机制,能够适应不同个体的输入形状,从而实现高效的跨个体解码。此外,研究团队引入了 Brain Instruction Tuning(BIT),这是一种新方法,通过多主体 fMRI 数据和文本注释增强模型从 fMRI 信号中提取多样化语义信息的能力。

研究结果显示,MindLLM 在多项任务中表现优异,包括脑部描述、问答和推理任务。相比现有模型,MindLLM 在下游任务上的性能提升了 12.0%,在未见个体上的泛化能力提高了 16.4%,在新任务上的适应性提升了 25.0%。此外,模型的注意力模式揭示了特定脑区与认知功能(如感知和推理)之间的联系,为神经科学研究提供了新的工具。

#神经技术 #脑机接口 #大脑信号解析 #大模型技术 #跨学科整合

阅读更多:

Qiu, Weikang, et al. MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding. arXiv:2502.15786, arXiv, 18 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.15786

Lottery LLM假设:探索大模型压缩中的关键能力

近日,香港科技大学和新加坡国立大学的研究团队提出了一项名为“Lottery LLM假设”的新理论,旨在探索大语言模型(LLMs)压缩过程中应保留的关键能力。随着LLMs在自然语言处理领域的广泛应用,其庞大的计算和存储成本成为了大规模部署的主要障碍。现有的压缩方法主要关注在基本语言任务上的性能保持,如困惑度或常识问答和基本算术推理任务的准确性,但忽略了LLMs在长上下文检索、生成和推理等高级能力上的损失。

研究团队回顾了LLMs在检索增强生成、多步推理、外部工具和计算表达能力方面的最新进展,并提出了Lottery LLM假设。该假设认为,对于给定的LLM和任务,存在一个较小的Lottery LLM,能够通过多步推理和外部工具的帮助,达到与原始LLM相同的性能。论文还提出了一个通用的推理算法,通过分而治之的策略解决问题,并讨论了彩票LLM必须具备的关键能力,如从提示中检索信息、识别所需的外部资源、规划和调度等。

研究结果表明,通过结合外部工具、知识库和强大的推理算法,Lottery LLM 有望成为类似人类认知的元代理,从而在大规模LLM应用中显著减少能源和资源消耗。

#认知科学 #大模型技术 #多步推理 #外部工具 #计算表达能力

阅读更多:

Tang, Zhenheng, et al. The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve? arXiv:2502.17535, arXiv, 24 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.17535

个性化AI教练显著提高戒烟成功率

代尔夫特理工大学的Nele Albers开发了一种基于心理知情强化学习的AI教练,旨在帮助吸烟者戒烟和戒用电子烟。她的研究基于行为改变理论和三项大型研究数据,考察了伦理、经济和心理因素,以提高电子健康应用的效果。

Nele Albers 开发的 AI 接口对话示例,其中用户感到想要吸烟并开始互动。Credit: Nele Albers

Nele Albers的研究方法包括开发一种AI教练,该教练使用强化学习技术,通过奖励学习的方式,类似于人类学习行为的方式。她的模型基于三项每项研究超过500名参与者的大型研究数据,并考察了伦理、经济和心理因素。研究结果显示,考虑到心理学原理的AI教练有巨大的潜力为想要戒烟的人提供有效的支持。通过考虑一个人当前和未来的状态来个性化支持,可以提高基于AI的电子健康应用的效果。她的模型可以判断在什么情况下需要除了AI教练之外再加入真人教练,并试图在吸烟者个人偏好与健康专家建议之间找到平衡。

#认知科学 #个性化医疗 #心理健康与精神疾病 #强化学习 #AI教练

阅读更多:

Albers, N. Psychology-Informed Reinforcement Learning for Situated Virtual Coaching in Smoking Cessation. 2025. Dissertation (TU Delft). TU Delft Research Portal, https://doi.org/10.4233/uuid:5e1d1500-1c45-4869-b995-6ed7db8f8b3b

每日一赛:AI模型优化数据中心

为了降低高性能计算机的运行成本并提高可靠性,美国能源部托马斯·杰斐逊国家加速器设施的团队开发了基于机器学习的管理系统DIDACT(数字数据中心孪生)。研究团队包括布莱恩·赫斯、艾哈迈德·胡萨姆·穆罕默德和戴安娜·麦斯帕登等。他们使用持续学习的方法训练人工神经网络,每天选出表现最佳的“日冠军”,以优化数据中心资源使用。

在杰斐逊实验室的数据中心内展示了一个名为“沙箱”的测试床计算集群。Credit: Jefferson Lab photo/Bryan Hess

DIDACT系统通过持续学习方法训练人工神经网络,使用名为“沙箱”的测试床集群进行模型评估。模型每天根据新数据竞争,选出误差最低的“日冠军”,用于实时监控数据中心行为。研究显示,DIDACT能够有效减少停机时间并优化资源使用,从而降低成本和提升科学效率。未来研究将探索优化数据中心能耗的机器学习框架,例如减少冷却用水或根据数据处理需求调整核心频率。研究发表在 IEEE Software 上。

#认知科学 #自动化科研 #预测模型构建 #数据中心优化 #机器学习

阅读更多:

McSpadden, Diana, et al. “Establishing Machine Learning Operations for Continual Learning in Computing Clusters: A Framework for Monitoring and Optimizing Cluster Behavior.” IEEE Software, vol. 42, no. 01, Jan. 2025, pp. 42–50. www.computer.org, https://doi.org/10.1109/MS.2024.3424256

AI也会“想太多”?减少过度思考让计算成本直降43%

大型推理模型在执行智能体任务时,面临推理与行动的困境,过度思考会导致性能下降。加州大学伯克利分校、UIUC、ETH Zurich、CMU等机构的研究者首次全面调研了这一问题,使用现实世界的软件工程任务作为实验框架,量化了LRM的过度思考行为。

研究者使用SWE-bench Verified基准和OpenHands框架内的CodeAct智能体架构,创建了一个受控环境,量化了LRM的过度思考行为。研究发现,LRM在推理-行动困境中倾向于内部模拟而非环境交互,导致性能下降。通过原生函数调用(native function-calling)和选择性强化学习(selective reinforcement learning),可以显著减少过度思考,提高模型性能,同时降低计算成本43%。

#认知科学 #大模型技术 #过度思考 #计算成本 #AI性能

阅读更多:

Cuadron, Alejandro, et al. The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks. arXiv:2502.08235, arXiv, 12 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.08235

HippoRAG 2框架突破大语言模型持续学习瓶颈

大型语言模型(LLM)在持续学习过程中长期面临参数化知识存储的局限,传统检索增强生成(Retrieval-Augmented Generation, RAG)虽能通过外部信息扩展模型能力,但其依赖向量检索的机制难以捕捉复杂知识关联。美国俄亥俄州立大学与伊利诺伊大学厄巴纳-香槟分校的研究团队开发的HippoRAG 2框架,通过整合神经生物学原理与知识图谱(Knowledge Graph, KG)技术,在事实回忆、意义构建和关联记忆任务中实现突破性进展,为人工智能系统赋予类人类的长时记忆能力。

研究团队基于神经科学中记忆形成机制,提出HippoRAG 2框架:模拟大脑新皮层(neocortex)的LLM负责语义处理,旁海马区编码器(parahippocampal encoder)构建知识图谱节点,开放知识图谱(KG)则动态整合概念与语境关联。该框架在保持传统RAG非参数化优势的同时,通过个性化网页排名算法(Personalized PageRank, PPR)优化检索路径,实现复杂推理与事实准确性之间的平衡。

研究团队在包含BM25、Contriever、GraphRAG等12种基线模型的对比实验中,验证了HippoRAG 2的综合优势。使用Llama-3.3-70B-Instruct作为核心LLM时,该系统在简单事实回忆任务中保持94.7%的准确率,同时在多跳推理任务中较最优基线模型提升7%,在金融反欺诈案例分析的语境理解任务中F1分数达82.1%。其核心突破在于通过神经生物学启发的记忆框架,将知识检索耗时降低43%,且无需修改模型参数即可实现动态知识更新。

目前该框架已在GitHub开源社区发布,其知识图谱动态扩展机制尤其适用于医疗诊断、法律文书分析等需要长期知识积累的领域。研究团队指出,HippoRAG 2的类脑记忆建模为开发具备持续学习能力的AI系统提供了新范式,未来计划将其扩展至对话场景的片段记忆(episodic memory)建模。

#人工智能 #持续学习 #知识图谱 #检索增强生成 #神经技术

阅读更多:

https://www.marktechpost.com/2025/03/03/hipporag-2-advancing-long-term-memory-and-contextual-retrieval-in-large-language-models/

整理|ChatGPT

编辑|丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。