█ 脑科学动态
从症状到护理计划:阿尔茨海默病诊断新框架
26个大脑区域如何控制脊髓中间神经元运动信号
跳过基因的“错误页”:SPLICER减少阿尔茨海默病相关蛋白前体
锂药物助力孤独症治疗,改善核心症状
2024 年改善大脑健康必问的 12 个问题
精神病学遗传研究的新时代:从内表型1.0到2.0的变革与未来
亲社会倾向如何塑造动态群体合作?
█ AI行业动态
马斯克xAI再获60亿美元融资:估值突破400亿美元
Hume AI推出OCTAVE:突破性语音语言模型赋予 AI 情感深度
ASAL:利用基础模型自动寻找人工生命
文档内联:通过复合AI跨越模态差距
█ AI研发动态
面部表情+语言分析:AI精准预测抑郁症严重程度
小数据大智慧,领域适应破解生物数据的泛化难题
机器人结合中医按摩技术,推动康复疗法创新
SSL加入“上下文”迈向通用模型
穿越恐怖谷:机器人学会“微表情”
合成多模态数据建模:破解医疗数据缺失的难题
脑科学动态
从症状到护理计划:阿尔茨海默病诊断新框架
阿尔茨海默病的早期诊断和评估方法已落后于当前的医学进展,为此,阿尔茨海默病协会组织了包括马萨诸塞州总医院、班纳健康研究所等在内的多学科团队,制定了一套全新的诊断指南。这项研究通过系统性文献分析和专家推荐,总结出19条面向所有临床环境的实用建议,以提升诊断质量和患者生活质量。
研究采用修改后的德尔菲方法,通过分析7374篇文献(133篇满足筛选标准),提出了一个高质量、循证支持的评估框架。该框架由以下三步组成:
认知功能状态(Cognitive Functional Status):分析认知受损程度,如轻度认知障碍或痴呆。
认知行为综合症(Cognitive-Behavioral Syndrome):明确患者的症状,如语言困难和记忆丧失等。
潜在脑部疾病(Underlying Brain Disease):通过脑成像和实验室测试,确认病因。
这一流程强调护理伙伴的重要性,并建议针对患者的症状和需求个性化诊断过程。研究特别指出,随着生物标志物和新工具的不断发展,这些指南可随时更新,为患者和医疗系统带来更大益处。研究发表在 Alzheimer's & Dementia 上。
#大脑健康 #阿尔茨海默病 #诊断指南 #认知障碍
阅读论文:
Atri, Alireza, et al. “Alzheimer’s Association Clinical Practice Guideline for the Diagnostic Evaluation, Testing, Counseling, and Disclosure of Suspected Alzheimer’s Disease and Related Disorders (DETeCD-ADRD): Executive Summary of Recommendations for Primary Care.” Alzheimer’s & Dementia, vol. n/a, no. n/a. Wiley Online Library, https://doi.org/10.1002/alz.14333. Accessed 24 Dec. 2024
“The Alzheimer’s Association Clinical Practice Guideline for the Diagnostic Evaluation, Testing, Counseling, and Disclosure of Suspected Alzheimer’s Disease and Related Disorders (DETeCD-ADRD): Validated Clinical Assessment Instruments.” Alzheimer’s & Dementia, vol. n/a, no. n/a. Wiley Online Library, https://doi.org/10.1002/alz.14335. Accessed 24 Dec. 2024
Dickerson, Bradford C., et al. “The Alzheimer’s Association Clinical Practice Guideline for the Diagnostic Evaluation, Testing, Counseling, and Disclosure of Suspected Alzheimer’s Disease and Related Disorders (DETeCD-ADRD): Executive Summary of Recommendations for Specialty Care.” Alzheimer’s & Dementia, vol. n/a, no. n/a. Wiley Online Library, https://doi.org/10.1002/alz.14337. Accessed 24 Dec. 2024
26个大脑区域如何控制脊髓中间神经元运动信号
肌肉运动依赖于复杂的大脑与脊髓神经回路的协调,而大脑如何通过脊髓中间神经元传递信号以控制运动长期未解。圣裘德儿童研究医院的研究团队,通过转基因狂犬病病毒和串行双光子断层扫描技术,生成了一个全脑图谱,详细揭示了26个大脑区域与V1中间神经元的单突触连接。该图谱和附属的三维交互网站为神经科学研究提供了开放的数据和工具。
▷Credit: Neuron (2024).
研究使用了转基因狂犬病病毒(rabies virus),该病毒被去除了糖蛋白(glycoprotein)以限制其传播范围,通过重新引入糖蛋白到特定V1中间神经元,病毒只能进行一次突触跳跃,便于追踪神经元连接路径。研究团队通过荧光标记技术,精确定位这些病毒的最终去向,并利用串行双光子断层扫描生成三维脑图。
结果显示,颈椎V1中间神经元接收到来自26个大脑区域的单突触输入,这些区域包括大脑皮层、中脑、小脑等。此外,研究发现V1中间神经元的两个主要亚群V1Foxp2和V1Pou6f2接收到不同来源的偏向性输入,例如前庭脊髓系统和GRN系统。该发现说明了脊髓上输入与分子特异性中间神经元之间存在的选择性连接模式,为理解大脑如何通过脊髓调控运动提供了重要基础。研究发表在 Neuron 上。
#神经科学 #神经技术 #脊髓神经元 #大脑图谱
阅读论文:
Chapman, Phillip D., et al. “A Brain-Wide Map of Descending Inputs onto Spinal V1 Interneurons.” Neuron, vol. 0, no. 0, Dec. 2024. www.cell.com, https://doi.org/10.1016/j.neuron.2024.11.019
跳过基因中的“错误页”:SPLICER减少阿尔茨海默病相关蛋白前体
阿尔茨海默病的主要病理标志之一是大脑中β淀粉样蛋白(Aβ)斑块的积累,这对患者的神经功能产生严重破坏。然而,现有基因编辑技术在解决与疾病相关的基因问题时面临效率和精度的限制。伊利诺伊大学厄巴纳-香槟分校的研究团队通过开发新型基因编辑工具SPLICER,显著提高了基因编辑效率,并成功减少了阿尔茨海默病小鼠模型中Aβ前体的形成。
SPLICER是一种基于CRISPR-Cas9的新工具,采用了最新的Cas9酶和碱基编辑器组合,能够同时编辑外显子的剪接受体(SA)和供体(SD)序列。这种方法不仅解决了传统技术中外显子跳跃不完全的问题,还显著提高了编辑效率。在实验中,研究人员靶向阿尔茨海默病相关基因APP的外显子17,减少了其编码的Aβ前体蛋白。在体外培养的神经元中,SPLICER显著减少了Aβ42肽的生成,并在小鼠模型中成功实现目标外显子表达的25%降低,且无脱靶效应。这些结果表明,SPLICER具有潜力成为一种治疗基因突变疾病的强大工具。研究发表在 Nature Communications 上。
#大脑健康 #阿尔茨海默病 #基因编辑 #外显子跳跃
阅读论文:
Miskalis, Angelo, et al. “SPLICER: A Highly Efficient Base Editing Toolbox That Enables in Vivo Therapeutic Exon Skipping.” Nature Communications, vol. 15, no. 1, Nov. 2024, p. 10354. www.nature.com, https://doi.org/10.1038/s41467-024-54529-y
锂药物助力孤独症治疗,改善核心症状
孤独症谱系障碍(ASD)患者及其家庭长期面临治疗难题,亟需新的干预手段。基础科学研究所突触脑功能障碍中心的Kim Eunjoon团队,通过研究发现,锂这一传统精神疾病药物,有潜力改善ASD相关脑部和行为异常。
▷锂可以将 Dyrk1a 缺陷小鼠的小头畸形、突触功能异常和沟通问题恢复到正常水平。Credit: Institute for Basic Science
研究团队采用一种携带人类Dyrk1a突变(Ile48LysfsX2)的基因敲入小鼠模型(Dyrk1a-I48K mice),模拟孤独症患者的核心表型。这些小鼠表现出严重的小头畸形(microcephaly)、神经树突缩短、突触缺陷及社交行为和认知能力问题。
研究对新生期的小鼠进行锂药物干预,结果表明,锂不仅能够恢复小鼠脑容量,还改善了神经信号通路及其相关的核心行为问题,疗效持续至成年期。质谱分析进一步揭示了锂通过Kalirin-7分子改善突触功能的机制。研究还发现,孤独症的核心病理可能源于信号通路异常,早期干预可有效阻止病理进展。研究发表在 Molecular Psychiatry 上。
#大脑健康 #孤独症 #锂治疗 #突触功能 #Kalirin-7
阅读论文:
Roh, Junyeop Daniel, et al. “Lithium Normalizes ASD-Related Neuronal, Synaptic, and Behavioral Phenotypes in DYRK1A-Knockin Mice.” Molecular Psychiatry, Dec. 2024, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41380-024-02865-2
2024 年改善大脑健康必问的 12 个问题
随着人类寿命延长,大脑健康成为全球关注的公共健康问题。美国神经病学学会(AAN)组织了一项研究,针对大脑健康的主要影响因素制定了一套讨论指南。研究团队通过专家协作和数据分析,探索了包括情绪管理、饮食调整在内的12个关键领域,旨在通过医生和患者的协作改善个体认知功能和整体大脑健康。
研究提出了一种基于互动的健康评估方法,涵盖12个领域,包括睡眠、情绪和心理健康、饮食与营养补充、锻炼等。每个领域附带具体问题供患者与医生讨论。具体包括以下内容:
睡眠:您能获得充足的睡眠以感到休息吗?
情绪、心理健康:您是否担心自己的情绪、焦虑或压力?
饮食与营养补充:您是否担心获取足够或健康的食物,或者对补充剂或维生素有疑问?
锻炼:您是否找到将体育锻炼融入生活的方法?
支持性社交互动:您是否与亲密的朋友或家人定期联系,并且是否得到足够的支持?
避免创伤:您是否系安全带、戴头盔,并使用儿童汽车安全座椅?
血压:您在家或就诊时是否有高血压问题,或者对血压治疗有担忧?
风险、遗传与代谢因素:您在控制血糖或胆固醇方面有困难吗?您的家族中是否有神经系统疾病?
负担能力与依从性:您对药物费用是否有困难?
感染:您是否了解最新疫苗,并对其信息足够了解?
负面暴露:您是否吸烟、每天饮酒超过1到2杯,或使用非处方药?您是否饮用井水或生活在污染区域?
社会和结构性健康决定因素:您是否担心住房、交通、获得护理和医疗保险,或身体和情感上免受伤害?
通过以上具体问题,研究显示,这种结构化的讨论不仅可以帮助患者识别潜在健康问题,还能通过针对性医疗资源改善大脑健康。研究强调了长期稳定的健康干预与社会支持的重要性。研究发表在 Neurology。
#大脑健康 #预防性神经病学 #健康社会决定因素 #认知功能改善
阅读论文:
Selwa, Linda M., et al. “The Neurologist’s Role in Promoting Brain Health.” Neurology, vol. 104, no. 1, Jan. 2025, p. e210226. neurology.org (Atypon), https://doi.org/10.1212/WNL.0000000000210226
精神病学遗传研究的新时代:从内表型1.0到2.0的变革与未来
近年来,随着遗传学和基因组学的快速发展,精神病学领域的“内表型”(endophenotype)研究也在经历深刻的变革。传统内表型1.0定义于上世纪60年代,作为疾病和基因型之间的可测量特征,覆盖神经生理、生化、内分泌、神经解剖、认知等多种领域。然而,这些定义和标准存在局限性,例如过于强调状态独立性、缺乏对治疗响应或环境风险因素的考虑等。
芝加哥大学的Chunyu Liu和Elliot S. Gershon团队提出的内表型2.0重新定义了这一概念。他们认为,内表型应包括“受基因影响且与疾病或治疗相关的特征”,并进一步强调遗传中介作用。这种中介作用不仅探讨基因与疾病之间的线性关系,还包含非线性和复杂网络效应。此外,新框架引入了与环境风险、疾病进展、治疗反应及复原能力相关的动态特征,显著拓宽了研究范围。
更新的内表型2.0标准旨在利用多维遗传与基因组数据,揭示精神疾病的潜在生物机制。这一进展对阿尔茨海默病、孤独症、精神分裂症等疾病的风险预测和治疗优化具有重要意义。例如,利用脑影像、眼动追踪和认知测量等数据,可通过因果分析和遗传中介研究明确基因、内表型与疾病的复杂关系。
内表型2.0的提出为精神病学领域提供了一个更灵活和全面的研究框架,有望解决遗传关联与疾病生物机制之间的“缺失环节”(missing biology),推动精准医学和跨学科研究的发展。
#精神病学 #遗传研究 #内表型2.0 #阿尔茨海默病 #精神分裂症
阅读论文:
Liu, Chunyu, and Elliot S. Gershon. “Endophenotype 2.0: Updated Definitions and Criteria for Endophenotypes of Psychiatric Disorders, Incorporating New Technologies and Findings.” Translational Psychiatry, vol. 14, no. 1, Dec. 2024, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41398-024-03195-1
亲社会倾向如何塑造动态群体合作?
合作是人类社会的核心,但动态群体中的合作机制尚不明确。Wojciech Zajkowski、Ryan P. Badman、Masahiko Haruno 和 Rei Akaishi 领导的国际研究团队,利用动态囚徒困境实验和功能性磁共振成像技术,揭示了记忆信心和亲社会倾向在动态群体合作中的重要作用,填补了相关研究空白。
研究团队在实验中要求参与者与随机选定的群体成员进行多轮囚徒困境博弈,并通过fMRI扫描分析其脑活动。实验显示,合作水平随着群体规模的增大而提升,但其背后机制是参与者稳定的亲社会倾向与基于记忆信心的动态互惠策略之间的平衡在大群体中发生偏移,倾向于更亲社会的决策。
在神经层面,梭状回(fusiform gyrus)和楔前叶(precuneus)负责编码记忆信心,而左背外侧前额叶皮层(DLPFC)和前扣带回皮层(dACC)则负责整合记忆信心与亲社会倾向。这一发现为理解动态群体合作的形成机制提供了新的视角。研究发表在 Communications Psychology 上。
#认知科学 #动态群体 #亲社会倾向 #记忆信心 #功能性磁共振成像
阅读论文:
Zajkowski, Wojciech, et al. “A Neurocognitive Mechanism for Increased Cooperation during Group Formation.” Communications Psychology, vol. 2, no. 1, Dec. 2024, pp. 1–16. www.nature.com, https://doi.org/10.1038/s44271-024-00177-3
AI 行业动态
马斯克xAI再获60亿美元融资:估值突破400亿美元
近日,马斯克创立的人工智能公司xAI宣布完成新一轮60亿美元融资,吸引了包括英伟达和AMD在内的97位投资者或机构参与。这使得xAI累计融资额达到120亿美元,公司估值突破400亿美元。
xAI计划将本次融资用于两大核心领域:基础设施升级和产品开发。首先,xAI计划扩建超级计算机“Colossus”,目标是实现20万个英伟达H200 GPU规模,用以支持大模型训练。其次,xAI正在加速开发其标志性人工智能产品Grok 3,据透露该产品将在年底发布。此外,xAI还推出了专有的图像生成模型Aurora,进一步增强多模态的理解和生成能力。
据悉,此轮融资的参与者主要为上一轮B轮融资的支持者,包括红杉资本、摩根士丹利等顶级机构。据报道,此次融资中部分资金可能直接用于与英伟达的合作。
自2023年7月成立以来,xAI发展迅速。今年5月完成B轮融资后,xAI仅用122天就建成并投入运行其超级计算机Colossus。Grok的免费功能已向Twitter用户开放,其iOS应用也即将上线。尽管xAI当前年收入约1亿美元,与竞争对手OpenAI和Anthropic相比仍有差距,但公司估值和增长潜力已显示出巨大的前景。
#人工智能 #马斯克 #xAI #大模型 #英伟达
阅读更多:
https://x.ai/blog/series-c
Hume AI 推出 OCTAVE:突破性语音语言模型,赋予 AI 情感深度
Hume AI 于 2024 年 12 月推出了一款名为 OCTAVE(Omni-Capable Text and Voice Engine,全功能文本和语音引擎)的全新语音语言模型,旨在解决当前 AI 在情感理解和表达方面的不足。OCTAVE 结合了 Hume AI 的 EVI 2 语音模型与 OpenAI 语音引擎、ElevenLab TTS 语音设计以及 Google DeepMind NotebookLM 的技术优势,为语音技术领域注入了情感计算的创新活力。
OCTAVE 的核心优势在于其多模态神经架构,能够整合声学、语言和情感信号。模型通过超过一百万个情感语音样本进行训练,精确标注情绪类型及强度,使其可以识别诸如讽刺、喜悦或沮丧等细腻的情感线索。此外,OCTAVE 在零样本和少样本学习场景中表现出色,能快速适应新的情感背景或语言,显著提高多功能性。
研究团队还强调了其高效的边缘设备部署能力,使模型在计算资源受限或低延迟需求场景中表现卓越。相比于主流模型如 Llama 3.1,尽管 OCTAVE 的 8B 版本在某些测试中稍显劣势,但其 3B 版本在 ARC(简单)等任务上表现突出,充分展现了其在情感理解和语言精度上的独特优势。
OCTAVE 的问世为情感感知 AI 开辟了广阔的应用前景,涵盖虚拟助手、互动故事讲述以及心理健康支持等领域。这一技术进步不仅增强了 AI 驱动的人机交互体验,还标志着语音语言模型向更真实、更具情感深度的方向迈进。
#语音技术 #人工智能 #情感计算 #语音模型 #人机交互
阅读更多:
https://www.hume.ai/blog/introducing-octave
ASAL:利用基础模型自动寻找人工生命
基于基础模型的人工生命(ALife)研究迎来了重要突破。由麻省理工学院(MIT)、Sakana AI 和瑞士人工智能实验室 IDSIA 等多家机构的研究人员联合开发的新方法——人工生命自动搜索系统(ASAL, Automated Search for Artificial Life),首次利用视觉-语言基础模型(Foundation Models, FMs)全面探索人工生命模拟的多样性和可能性。
ASAL 系统通过三种创新方式寻找人工生命模拟:(1) 通过文本提示发现特定目标现象;(2) 通过开放性探索,识别能够产生持续创新的模拟;(3) 阐明模拟空间的多样性,以探索更多未知的“生命”形式。研究成果包括发现全新的 Lenia 和 Boids 生命形态,以及类似康威生命游戏(Conway’s Game of Life)的开放式细胞自动机,这些都拓展了人工生命的边界。
这一系统解决了 ALife 领域长期以来的难题:手动设计模拟规则的高成本与低效率。通过基础模型的强大泛化能力,ASAL 不仅可以定量分析原本难以量化的复杂现象,还能在人类关注的方向上进行创新性探索。研究人员认为,这种方法为人工生命研究提供了全新的思路,有望加速实现探索“可能的生命”的终极目标。
#人工智能 #越狱技术 #BoN算法 #AI安全 #Anthropic
阅读更多:
https://pub.sakana.ai/asal/
文档内联:通过复合AI跨越模态差距
当前,全球大部分数据(如医疗记录、播客、财务报表)以图像、PDF、音频文件或专用知识库形式存在,这些格式难以被大型语言模型有效处理。虽然视觉语言模型(VLM)和多模态模型试图填补这一空白,但它们在输入类型和推理能力上仍存在局限,导致结果质量低下且成本较高。
Fireworks推出了文档内联(Document Inlining),这是一个复合系统,能够自动将任何LLM转变为视觉模型,以处理图像或PDF等文档。它能够通过使用任意LLM或专用模型,提升推理和生成能力;自动转换多种文件类型,如PDF和截图,支持表格和图表等丰富结构;兼容OpenAI API,在 Fireworks 中,启用Document Inlining功能仅需在现有的 API 中添加一行代码即可实现。目前处于公开预览阶段,使用文档内联不会产生额外解析成本,仅需支付输入和输出的Token费用。
实验发现,文档内联在68%的情况下优于直接使用图像输入的GPT4o模型。此外,使用文档内联的VLM在响应质量上显著提升。文档内联展示了复合AI系统的强大能力,通过专用解析器和推理模型,实现更高质量、更快速且更具成本效益的结果。Fireworks将继续扩展文档内联功能,涵盖音频文件内联和对长文档的推理时搜索等。
#人工智能 #数据处理
阅读更多:
https://fireworks.ai/blog/document-inlining-launch#quality-evaluation
AI 研发动态
面部表情+语言分析:AI精准预测抑郁症严重程度
抑郁症是一种广泛存在却常被忽视的公共健康问题,全球有约5%成年人受其影响。针对传统诊断方法易受主观偏差影响的局限性,来自德国埃尔兰根-纽伦堡大学的Misha Sadeghi等研究人员,利用E-DAIC数据集,结合大型语言模型(LLMs)与视频特征,开发了多模态分析方法,提高了抑郁症的检测精度。
研究采用了多模态方法,通过大型语言模型分析面试文本,提取抑郁相关的语言特征,同时从视频帧中提取视觉特征(如面部表情、眼神方向)。基于这些数据,研究构建了三种模型:仅文本、仅视觉以及文本与视觉结合的多模态模型,并使用PHQ-8问卷分数(国际抑郁测量标准)进行模型训练和评估。
结果表明,纯文本模型已能实现高效准确的抑郁症预测,平均绝对误差(MAE)为2.85,均方根误差(RMSE)为4.02;结合语音质量后,模型性能进一步提高,显示出多模态方法的显著优势。这一研究验证了自动化诊断技术的潜力,有望为未来的心理健康管理提供新工具。研究发表在 npj Mental Health Research 上。
#大脑健康 #抑郁症 #多模态分析 #人工智能诊断
阅读更多:
Sadeghi, Misha, et al. “Harnessing Multimodal Approaches for Depression Detection Using Large Language Models and Facial Expressions.” Npj Mental Health Research, vol. 3, no. 1, Dec. 2024, pp. 1–14. www.nature.com, https://doi.org/10.1038/s44184-024-00112-8
小数据大智慧,领域适应破解生物数据的泛化难题
传统机器学习模型因数据分布差异难以泛化到新数据集。为解决这一问题,来自哥伦比亚大学、加州大学尔湾分校的 Seyedmehdi Orouji、Martin C. Liu、Tal Korem 和 Megan A. K. Peters 分析了领域适应(Domain Adaptation, DA)的潜力,提出其在小规模生物数据集中整合和转移知识的应用。研究结果揭示了如何在数据不足的情况下挖掘生物学规律。
领域适应是一种迁移学习技术,能够通过对数据分布的对齐,找到跨数据集的通用特征。该技术在孤独症数据集(ABIDE)和肿瘤微生物组研究中显示了潜力。具体而言,DA能够通过整合不同来源的数据集,缓解单个数据集样本不足的问题。研究指出,通过将成年人体脑部MRI的知识迁移到新生儿的脑部研究,或将细胞系的注释迁移到临床数据集,DA能够有效扩展模型的应用范围。此外,DA还能够减少数据统计偏差的影响,确保模型更关注生物学意义而非统计偶然性。
尽管如此,生物数据的异质性(如特征缺失、样本-特征比不平衡)仍为DA的应用带来挑战。团队建议未来开发更加适合小规模生物数据的定制化DA方法,以更好地服务于生物学发现和健康研究。这一综述为领域适应在生物学中的应用提供了全面视角,发表在 Science Advances 期刊。
#神经技术 #领域适应 #迁移学习 #生物数据集
阅读更多:
Orouji, Seyedmehdi, et al. “Domain Adaptation in Small-Scale and Heterogeneous Biological Datasets.” Science Advances, vol. 10, no. 51, Dec. 2024, p. eadp6040. science.org (Atypon), https://doi.org/10.1126/sciadv.adp6040
机器人结合中医按摩技术,推动康复疗法创新
中医按摩在缓解疼痛和促进康复中具有显著疗效,但手法复杂,对技师经验要求高。上海交通大学与上海理工大学的研究团队通过机器人技术模拟传统中医按摩,为医疗保健和康复治疗带来了新工具。研究利用自适应导纳控制算法,从运动学和动力学角度解析按摩技法,并开发出多功能机械手,有效再现了四种典型按摩手法。
▷Credit: Xu et al.
研究团队采用动作捕捉系统Optitrack和按摩强度测量仪ZTC-II(用于记录按摩手法和力道的设备),收集了专业中医按摩师的操作数据,并以此训练机器人控制算法。机器人系统由两个机械臂组成,末端配备模拟人手的机械按摩手,具有掌击(Palm-punch)、振动(Vibration)、揉捏(Kneading)和指法(Finger technique)四种模式。实验结果显示,该系统能够成功复制敲打、按压、推压和振动四种中医按摩技术,按摩过程舒适且安全。
#神经技术 #中医按摩 #机器人控制 #康复治疗
阅读更多:
Xu, Yuan, et al. Digital Modeling of Massage Techniques and Reproduction by Robotic Arms. arXiv:2412.05940, arXiv, 8 Dec. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2412.05940
自监督学习加入“上下文”迈向通用模型
自监督学习(SSL)在机器学习领域广泛应用,但传统方法依赖固定数据增强策略,限制了模型在不同任务中的适应能力。来自麻省理工学院计算机科学与人工智能实验室(CSAIL)和慕尼黑工业大学的研究人员,开发了一种名为情境自监督学习(ContextSSL)的新算法。该方法通过融入上下文记忆模块,实现了灵活的任务调整,大幅提升了模型的泛化性能和公平性。
ContextSSL的核心方法是通过Transformer模块编码上下文信息,包括状态-动作-下一个状态的三元组。这里,“动作”表示数据增强的类型,当前状态和未来状态分别表示增强前后的输入表示。通过这种设计,模型能够在特定任务中动态调整其表示的对称性,适应不变性(invariance)和等变性(equivariance)的要求。
实验表明,ContextSSL在多个计算机视觉基准任务中表现出显著优势。例如,在CIFAR-10数据集上,其准确性相比传统方法提升了约10%。在医疗领域,ContextSSL在MIMIC-III数据集上成功实现了性别敏感任务的改进,同时在公平性指标(如均等赔率和机会均等)上取得更高分数。
#神经技术 #自监督学习 #上下文记忆 #等变性
阅读更多:
Gupta, Sharut, et al. In-Context Symmetries: Self-Supervised Learning through Contextual World Models. arXiv:2405.18193, arXiv, 28 May 2024. arXiv.org, https://doi.org/10.48550/arXiv.2405.18193
穿越恐怖谷:机器人学会“微表情”
面部表情的自然性是提升机器人情感交流能力的关键。大阪大学的 Hisashi Ishihara 团队提出了一种创新技术,通过动态表情合成显著改善机器人表情的自然性和情感表达能力。研究展示了机器人如何通过波形运动实时调整面部表情,实现更加类人的交互体验。
▷儿童机器人机器人上实现的困倦情绪表达的快照。Credit: Hisashi Ishihara
研究提出了一种基于波形运动(waveform movements)的动态表情生成系统,通过将面部运动分解为如“呼吸”“眨眼”“打哈欠”等逐渐衰减的波形(decaying waves),并根据机器人内部状态(如唤醒水平,arousal level)动态调整波形参数,从而生成流畅自然的面部表情。
具体而言,该系统通过数学模型自动生成各面部驱动器的控制信号,无需预设动作数据。在实验中,这一系统在儿童型机器人的面部上得到了验证。结果表明,经过调优的波形表情不仅能够准确传达不同的情感状态,还能在保持类人特性(如自然过渡和协调性)的同时避免传统方法中表情生硬或切换突兀的问题。研究发表在 Journal of Robotics and Mechatronics 上。
#认知科学 #波形运动 #机器人表情 #人机情感交流
阅读更多:
Hisashi Ishihara et al, Automatic Generation of Dynamic Arousal Expression Based on Decaying Wave Synthesis for Robot Faces, Journal of Robotics and Mechatronics (2024). DOI: 10.20965/jrm.2024.p1481
合成多模态数据建模:破解医疗数据缺失的难题
近年来,生物医学领域的研究面临数据缺失的挑战。患者的医疗数据通常由分子(如基因测序)、影像(如MRI扫描)、传感器(如心率监测)等多种模态组成,但这些模态的数据获取昂贵且不易实现。针对这一问题,斯坦福大学等机构的研究团队提出了一种创新方法——合成多模态数据建模,利用基础模型补全缺失数据并生成真实感的合成样本。
合成多模态数据建模的核心是通过大规模预训练模型整合多模态数据的信息,提升数据补全的质量。这种方法不仅可以解决单模态和跨模态数据补全的局限性,还能够支持in silico假设测试——在模拟环境中通过调整数据模态研究其对疾病状态的影响。此外,该模型可以动态更新患者的数据状态,为个性化治疗提供精准支持。例如,在不进行侵入性活检的情况下,模型可基于放射影像和临床数据预测肿瘤的基因信息,为诊断和治疗决策提供依据。
尽管前景广阔,这一方法仍需解决多个挑战,包括生成数据质量的评估、数据隐私的保护以及应对数据偏差的问题。研究团队强调,全球范围内建立标准化、多样化的医学数据集将是未来的关键一步。
#神经技术 #多模态数据 #数据补全 #基础模型
阅读更多:
Carrillo-Perez, Francisco, et al. “Synthetic Multimodal Data Modelling for Data Imputation.” Nature Biomedical Engineering, Dec. 2024, pp. 1–5. www.nature.com, https://doi.org/10.1038/s41551-024-01324-1
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。
热门跟贴