█ 脑科学动态
心智模型:全脑协作的新认知框架
不同场景下,惊讶如何被大脑统一“翻译”
NAD 的电池角色:如何帮助细胞对抗衰老
感官预测如何帮助大脑更好地应对动作扰动
早产导致高血压高发,但心血管风险更低
普萘洛尔显著缓解帕金森病患者的震颤症状
六个月大婴儿如何识别非语言信号并用其学习
从百万细胞中解码衰老与性别的奥秘
运动线索与静态图像同样助力对象分类
█ AI行业动态
突破3D细胞分割瓶颈——CellSeg3D发布最新版本
谷歌DeepMind探索新方法,提升大模型推理能力
Meta AI 推出“概念驱动”语言模型LCM,开启人类化推理新时代
阿里巴巴推出增强视觉推理能力的开源AI模型“QVQ”
█ AI驱动科学
SIMPL2:药物研发的蛋白质相互作用检测利器
微型机器人实现精准药物递送与实时成像
变分自编码器的进化:LMMVAE如何破解数据依赖难题
OpenAI o1模型:如何在智能化与安全性之间找到平衡
三张图像解锁个性化视觉新能力
脑科学动态
心智模型:全脑协作的新认知框架
认知科学中,理解大脑如何整合复杂信息是一大挑战。剑桥大学的研究人员探讨了心智模型的概念,提出它是一种整合全脑信息的状态。研究结合认知心理学和神经科学理论,通过分析多种脑网络功能,揭示了前景与背景信息的动态交互机制。
研究通过脑功能影像分析和认知任务测试,揭示了心智模型的核心特性。模型包括前景(Attentional Foreground)和背景(Background)。前景由多需求网络(multiple-demand network)整合,支持当前任务相关信息的处理,如感知和动作协调;背景信息则由默认模式网络(default mode network)组织,涵盖长期记忆和静默态工作记忆(activity-silent working memory),通过快速与长期突触变化维持其功能。
研究显示,前景与背景的信息切换决定了认知效率。例如,在实验中,猴子的神经记录显示前景信息主导当前任务,而背景信息以隐性编码形式存在,随时准备切换为前景。当这种切换机制失效时,会导致目标忽视(goal neglect),即个体在复杂任务中忽略部分关键目标。研究提出,心智模型作为全脑状态,整合多种脑网络信息,支持从认知控制到学习等多样化的认知功能。这一理论为认知神经科学提供了统一框架,研究发表在 Neuropsychologia 上。
#认知科学 #心智模型 #多需求网络 #默认模式网络 #神经整合
阅读论文:
“Construction and Use of Mental Models: Organizing Principles for the Science of Brain and Mind.” Neuropsychologia, vol. 207, Jan. 2025, p. 109062. www.sciencedirect.com, https://doi.org/10.1016/j.neuropsychologia.2024.109062
不同场景下,惊讶如何统一被大脑“翻译”
人类在面对突发事件时会产生惊讶,但这一心理现象是否在不同情境中共享类似的神经机制尚不明确。芝加哥大学心理学系和脑与生物研究所的 Ziwei Zhang 和 Monica D. Rosenberg 等研究人员通过功能性磁共振成像(fMRI)和数据驱动的网络建模,研究了这种现象的神经基础,发现惊讶的神经动态在不同场景中具有共同性。
研究使用惊讶边缘波动预测模型(Surprise Edge-Fluctuation-Based Predictive Model, EFPM),通过无参数分析方法捕捉大脑区域间的高频动态交互。EFPM模型首先在适应性学习任务中验证,并准确预测了信念被打破时的惊讶程度。随后研究扩展至两种不同情境:一是观众观看篮球比赛中的胜负概率变化,二是观看违反心理预期的动画视频。EFPM在这两种情境中均表现出强泛化能力,能准确预测瞬时的惊讶程度,并优于基于传统大脑网络的模型。研究还表明,惊讶的神经机制由分布在前顶叶网络、默认模式网络及边缘系统的多个大脑区域协同支持。这些发现揭示了不同心理体验的惊讶可通过大脑动态交互“翻译”成共享的神经过程。研究发表在 Nature Human Behaviour 上。
#认知科学 #神经技术 #信念不一致的惊讶 #功能性磁共振成像
阅读论文:
Zhang, Ziwei, and Monica D. Rosenberg. “Brain Network Dynamics Predict Moments of Surprise across Contexts.” Nature Human Behaviour, Dec. 2024, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41562-024-02017-0
NAD 的电池角色:如何帮助细胞对抗衰老
细胞内 NAD (烟酰胺腺嘌呤二核苷酸)水平的下降被认为与衰老及多种疾病密切相关,但其调节机制尚不清楚。来自挪威卑尔根大学生物医学系的 Mathias Ziegler 研究团队采用高分辨率质谱和基因编辑技术,揭示了线粒体在 NAD 水平调控中的核心作用。他们的研究结果表明,线粒体充当 NAD 储存库,可以在需求增加时为细胞提供 NAD 支持,并通过独特的分子机制缓解其不足。
▷SLC25A51 和 NMNAT3 合作缓冲细胞 NAD +波动的模型。Credit: Nature Metabolism (2024).
研究人员利用 CRISPR-Cas9 基因组编辑技术,构建了稳定表达 PARP 活性的细胞系,分别在线粒体、细胞质、内质网和过氧化物酶体等不同细胞区室引发 NAD+ 过度消耗。他们发现,这些操作导致 NAD 浓度下降可达 50%,但细胞通过线粒体的 NAD 导入蛋白 SLC25A51(线粒体 NAD 转运蛋白)和 NMNAT3(烟酰胺单核苷酸腺苷转移酶3)逆向生成 NAD 的机制,维持了 NAD 水平平衡。
此外,研究揭示,线粒体储备的 NAD 相当于一个“虚拟池”,为应对细胞代谢需求提供支持。然而,若线粒体或其 NAD 储备长期受损,细胞将难以维持关键的能量依赖过程。研究还指出,尽管衰老过程中 NAD 水平下降,但线粒体功能的保护可以显著缓解与其相关的病理状态。研究发表在 Nature Metabolism 上。
#大脑健康 #NAD水平 #线粒体功能 #衰老机制
阅读论文:
Høyland, Lena E., et al. “Subcellular NAD+ Pools Are Interconnected and Buffered by Mitochondrial NAD+.” Nature Metabolism, vol. 6, no. 12, Dec. 2024, pp. 2319–37. www.nature.com, https://doi.org/10.1038/s42255-024-01174-w
感官预测如何帮助大脑更好地应对动作扰动
运动准备与感官输入的预期关系密切,但其具体神经机制尚不清晰。美国加州大学圣地亚哥分校和麦吉尔大学的研究人员通过实验探讨这一问题。他们使用运动任务和高密度神经记录技术,研究人类和猕猴如何根据感官扰动的预期调整运动准备过程。研究表明,感官预期不仅影响神经活动,还能显著提高对机械扰动的响应表现。
研究方法包括设计概率性提示扰动方向的实验任务,记录人类参与者(N=20)在机械臂(KINARM)中的动作表现,以及猕猴的神经活动。他们观察到,概率提示的增加使参与者更快、更准确地应对扰动。这些扰动引发了短潜时(SLR)和长潜时(LLR)的反射活动,其中长潜时反射显著受到概率提示的影响。此外,高密度神经记录揭示了这种感官预期如何调整神经几何(neural geometry),优化了运动纠正反应。数学模型显示,这种优化依赖于感官信号和触发信号的时序一致性。
#神经科学 #感官预期 #运动准备 #长潜时反射 #神经几何
阅读论文:
Michaels, Jonathan A., et al. Sensory Expectations Shape Neural Population Dynamics in Motor Circuits. bioRxiv, 23 Dec. 2024, p. 2024.12.22.629295. bioRxiv, https://doi.org/10.1101/2024.12.22.629295
早产导致高血压高发,但心血管风险更低
早产儿健康风险一直是公共健康关注的热点。为了解早产对成年中期健康的具体影响,奥克兰利金斯研究所的研究团队对一项产前倍他米松(antenatal betamethasone)试验的幸存者进行了长达50年的随访研究。研究发现,尽管早产者的高血压风险较高,但心血管事件的总体风险较低,为早产的长期影响提供了更清晰的现代视角。
这项研究的核心方法是健康调查问卷与行政数据分析相结合,同时对婴儿期死亡的个体通过行政数据进行评估。主要健康结果包括糖尿病(diabetes mellitus)、糖尿病前期(prediabetes)、高血压(hypertension)等,以及心血管事件(major adverse cardiovascular events, MACEs)。在470名参与者中,主要结局发生率为早产组34.5%和足月组29.9%,差异无统计学意义(aRR 1.14)。然而,早产组心血管事件的发生率显著低于足月组(2.8% vs 6.9%,aRR 0.33),但高血压自报率较高(34.7% vs 19.8%,aRR 1.74)。
研究还发现,糖尿病、血脂异常等其他健康指标在两组间无显著差异。早产对心理健康的影响较小,早产者的抑郁率更低(38.2% vs 52.9%)。这些发现为未来的健康干预策略提供了重要依据。研究发表在 Pediatrics 杂志上。
#大脑健康 #早产 #长期健康风险 #高血压 #心血管事件
阅读论文:
Walters, Anthony G. B., et al. “Health Outcomes 50 Years After Preterm Birth in Participants of a Trial of Antenatal Betamethasone.” Pediatrics, Dec. 2024, p. e2024066929. Silverchair, https://doi.org/10.1542/peds.2024-066929
普萘洛尔显著缓解帕金森病患者的震颤症状
帕金森病震颤在压力条件下会加剧,而常用药物左旋多巴在这些情况下效果有限。拉德堡德大学医学中心的Rick Helmich团队开展了一项研究,探讨普萘洛尔是否能有效减少帕金森病震颤,以及该药物作用是否与压力条件相关。他们通过双盲交叉实验发现,普萘洛尔显著降低了震颤强度,并揭示了相关的脑部活动机制。
研究使用交叉双盲实验设计,涉及27名帕金森病患者。这些患者分别在两天内服用普萘洛尔(40mg)和安慰剂。研究通过加速度计和功能性磁共振成像(fMRI)记录震颤强度和脑部活动,同时利用数学任务引发压力以测量压力响应(如瞳孔直径和心率)。结果显示,压力条件下震颤强度显著增加,但普萘洛尔显著降低了震颤强度,无论是否处于压力条件。fMRI揭示,普萘洛尔显著减少了运动皮层中的震颤相关活动,表明其在静息状态和压力情境下均能发挥作用。
研究还发现,压力情境激活了认知控制网络,而震颤相关活动则集中在小脑-丘脑-皮质网络,进一步支持去甲肾上腺素(noradrenaline)在震颤中的放大作用。这项研究首次提供了普萘洛尔在帕金森病震颤中的确切机制,为临床治疗提供了新选择。研究发表在 Annals of Neurology 上。
#大脑健康 #帕金森病 #震颤 #普萘洛尔
阅读论文:
van der Heide, Anouk, et al. “Propranolol Reduces Parkinson’s Tremor and Inhibits Tremor-Related Activity in the Motor Cortex: A Placebo-Controlled Crossover Trial.” Annals of Neurology, vol. n/a, no. n/a. Wiley Online Library, https://doi.org/10.1002/ana.27159. Accessed 25 Dec. 2024
六个月大婴儿如何识别非语言信号并用其学习
人类从非语言信号(如烟雾信号和莫尔斯电码)中获取信息的灵活性可以在婴儿期早期观察到。西北大学的 Sandra Waxman、Brock Ferguson 和 Alexander LaTourrette 通过实验,探讨了六个月大的婴儿如何通过新颖的正弦波音调信号完成学习任务,研究发现跨模式时间同步是关键条件。
研究通过展示动画短片,让六个月大的婴儿接触新颖的正弦波音调信号(sine-wave tones,一种中性、不含语义信息的音调信号)。短片包含四种场景:1. 音调信号与英语句子交替出现;2. 音调信号完全替代英语句子;3. 单一角色同步运动并发出音调;4. 角色与音调不同步。随后,婴儿参与对象分类任务。研究发现,婴儿在音调与角色运动同步时,能够将音调视为交流信号并用其完成分类任务;当同步性被破坏时,学习效果消失。这表明时间同步为婴儿提供了信号意义的推断依据。研究成果发表在 Scientific Reports 上。
#认知科学 #非语言信号 #时间同步 #语言习得
阅读论文:
Ferguson, Brock, et al. “Six-Month-Old Infants Use Cross-Modal Synchrony to Identify Novel Communicative Signals.” Scientific Reports, vol. 14, no. 1, Nov. 2024, p. 27859. www.nature.com, https://doi.org/10.1038/s41598-024-78801-9
从百万细胞中解码衰老与性别的奥秘
单细胞转录组技术为研究人类细胞类型和疾病相关基因表达提供了前所未有的洞察。加州大学旧金山分校和Chan Zuckerberg Biohub等机构的研究人员通过Tabula Sapiens 2.0 图谱扩展了细胞数据量,利用多种先进技术分析了110万个细胞的数据,揭示了性别和衰老的分子机制。
研究团队对九位捐赠者提供的24种组织的单细胞样本进行了分析,利用微滴微流体技术(droplet microfluidic emulsions,一种将单细胞分离并封装在微小液滴中的技术)和流式细胞分选(FACS,fluorescence-activated cell sorting,通过荧光标记分离单细胞的技术)生成数据。他们发现了超过一千种转录因子的细胞类型特异性表达,并探索了其潜在的调控作用。
衰老细胞的分子表型分析揭示了一些普遍的衰老特征,同时展示了特定器官和细胞类型的独特变化。这些发现为理解衰老的细胞基础提供了新的视角。此外,性别特异性基因表达的研究表明,性别差异主要由细胞类型特异性的基因调控机制决定,而不是由组织间的固有差异驱动。为促进数据的应用,研究团队开发了一个基于大型语言模型的网络工具,用户可以通过它轻松查询捐赠者的健康记录。
#认知科学 #单细胞转录组 #性别差异 #衰老细胞
阅读论文:
Quake, Stephen R., and The Tabula Sapiens Consortium. Tabula Sapiens Reveals Transcription Factor Expression, Senescence Effects, and Sex-Specific Features in Cell Types from 28 Human Organs and Tissues. bioRxiv, 4 Dec. 2024, p. 2024.12.03.626516. bioRxiv, https://doi.org/10.1101/2024.12.03.626516
运动线索与静态图像同样助力对象分类
人类视觉系统如何通过运动线索进行对象分类一直是未解之谜。国际研究团队通过新型“物体运动图”(object kinematograms)方法,对6类对象的动态和静态线索进行了对比分析。实验结合功能性磁共振成像(fMRI)技术,结果揭示了运动线索在对象分类中的重要作用,拓展了关于视觉皮层如何处理动态信息的认知。
研究团队设计的“物体运动图”通过随机点动态图(random dot kinematograms)模拟视频中的运动信息,以避免静态形态线索的干扰。15名受试者在接受fMRI扫描时观看动态和静态线索的刺激图像。结果显示,动态和静态线索均能在视觉皮层的高阶区域中解码出类别信息。其中,后侧腹侧区域更善于处理静态线索,而前侧背侧区域在动态条件下表现优异。此外,跨两种刺激形式的解码分析表明,大脑存在抽象类别表征,能够泛化静态和动态信息。
研究指出,运动线索能与传统的静态视觉线索同样精确地触发大脑中的类别响应,且两者在大脑视觉皮层的多区域内均可泛化。这一研究成果为对象类别处理的多重视觉机制提供了新视角,并为未来的神经科学研究奠定了重要基础。研究发表在 Journal of Neuroscience 上。
#认知科学 #视觉对象分类 #物体运动图 #功能性磁共振成像
阅读更多:
Robert, Sophia, et al. “Disentangling Object Category Representations Driven by Dynamic and Static Visual Input.” Journal of Neuroscience, vol. 43, no. 4, Jan. 2023, pp. 621–34. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.0371-22.2022
AI 行业动态
突破3D细胞分割瓶颈——CellSeg3D发布最新版本
近日,由Adaptive Motor Control Lab团队主导的CellSeg3D工具更新至0.2.2版本,为3D细胞分割领域带来诸多新突破。这款工具以其模块化设计和强大的功能在研究界备受关注,其最新版本在方法、数据和可用性上进一步提升。
此次更新主要包含四项创新:
WNet3D模型:该团队推出了全新自监督学习模型WNet3D(无需3D标签的神经网络模型),有效解决了3D标注数据稀缺的问题,同时性能可媲美甚至超越传统监督学习模型。
集成领先的Transformer模型:新版本支持顶级Transformer(基于深度学习的模型架构),分割性能优于Cellpose和Stardist两款主流工具。
模块化Napari插件:CellSeg3D现已成为一个功能强大的Napari(开源图像可视化工具)插件,支持用户灵活替换和扩展模型,大大提升了工具的实用性和适配性。
全新3D神经GT数据集:研究团队还公开了一个高质量的3D神经组织标注数据集,为后续研究提供了宝贵资源。
用户可通过 GitHub 获取源代码,也可在 HuggingFace 和 Zenodo 下载预训练模型和新数据集。此外,研究团队还提供了丰富的教程视频和实验笔记,以帮助用户快速上手。
#CellSeg3D #3D细胞分割 #WNet3D #Transformer模型 #Napari插件
阅读更多:
https://adaptivemotorcontrollab.github.io/CellSeg3D/welcome.html
谷歌DeepMind探索新方法,提升大模型推理能力
谷歌DeepMind团队最近提出了一种创新技术,通过可微分缓存增强(Differentiable Cache Augmentation)显著提升大语言模型(LLM)的推理能力。这一方法的核心在于,通过引入一个离线协处理器(coprocessor)优化模型的关键-值缓存(kv-cache),从而减少推理任务的复杂度,提高模型性能。
传统的LLM需要生成离散的中间推理步骤,这种方式虽然有效,但通常伴随较高的计算延迟,并难以实现端到端优化。而这项新方法采用了一种完全不同的思路:在语言模型解码时,协处理器对缓存中的数据进行处理,并生成一种潜在嵌入(latent embeddings),从而增强后续解码过程的准确性。
研究显示,这种增强方式具备以下三大优势:1. 端到端可微性:通过在标准预训练数据上使用语言建模损失,协处理器实现了高效的优化,无需借助强化学习。2. 异步操作:协处理器可以离线运行,即使在协处理器不可用的情况下,模型也能保持正常功能。3. 推理性能提升:实验表明,即便无需任务特定的微调,该方法在多个推理密集型任务中均取得显著进步。例如,在GSM8K和MMLU任务中,注入64个潜在嵌入分别实现了10.05%和4.70%的性能提升。
本研究为大语言模型提供了一种新的“内存优化”策略,使其能更高效地利用计算资源完成复杂任务。这种基于缓存增强的协处理器框架或将成为未来推动语言模型发展的重要方向。
#大语言模型(LLM) #缓存增强 #推理优化
阅读更多:
https://www.hume.ai/blog/introducing-voice-control
Meta AI 推出“概念驱动”语言模型LCM,开启人类化推理新时代
Meta AI 近日推出了一种全新的语言模型架构——“大概念模型”(Large Concept Model, LCM),旨在模拟人类的思考方式,以“概念”为中心进行语言处理。这一创新颠覆了传统语言模型逐字生成的模式,带来了逻辑更清晰、任务处理更复杂的人工智能语言工具。
与目前流行的 GPT 等模型不同,LCM 基于“概念”进行操作,将每个句子视为一个完整的“概念”(concept),在句子层面推理与生成,而非单纯依赖逐词或逐字的方式。这种语言和模态无关的高级语义表示,帮助模型以更高的抽象层次展开推理,尤其适合多语言、多模态任务。LCM 支持多达 200 种语言的文本输入和 76 种语言的语音输入,甚至能够直接理解手语。
LCM 的优势还体现在长文本生成和逻辑复杂任务的处理上。例如在故事创作或论文写作中,LCM 生成的内容更连贯、更一致。此外,该模型具备强大的零样本泛化能力,无需额外训练即可胜任新任务,这使其在逻辑一致性和跨语言支持上超越传统模型(如 GPT 和 LLaMA)。
这一技术突破为自然语言处理开辟了新的方向,不仅提升了 AI 的推理能力,也让其更贴近人类思维方式,适用于多种复杂场景,从多模态任务到长文本生成。LCM 的出现,或将成为人工智能领域的新里程碑。
#MetaAI #LargeConceptModel #自然语言处理 #多模态AI #语言生成
阅读更多:
https://ai.meta.com/research/publications/large-concept-models-language-modeling-in-a-sentence-representation-space/
阿里巴巴推出增强视觉推理能力的开源AI模型“QVQ”
阿里巴巴Qwen团队近日发布了全新开源图像识别AI模型“QVQ-72B-Preview”,这是基于其大规模语言模型Qwen2-VL-72B的增强版。QVQ-72B-Preview以其在视觉推理领域的卓越表现备受瞩目,被视为探索AI多模态技术的新突破。
该模型的开发目标在于提升图像推理能力,尤其是在视觉理解与多步骤推理中的表现。早前的Qwen2-VL-72B于2024年9月发布,已经能够理解视频内容并支持多种语言。与之相比,QVQ-72B-Preview在“MMMU”(多模态理解与推理)等基准测试中表现出色,不仅超越前作,还逐步缩小与OpenAI最新模型o1之间的差距。此外,它在数学与物理能力测试中也取得了显著进步。
尽管如此,研究团队明确表示QVQ-72B-Preview仍为实验性模型,尚存若干技术限制。例如,它目前无法处理视频输入,可能在推理中陷入循环逻辑,甚至对图像内容产生“幻觉”(错误的推断)。此外,模型的多语言混合回复也对实际应用提出了更高的安全与可靠性要求。
工程师Simon Willison在Hugging Face平台试用了该模型,并分享了其在计数鹈鹕和估算恐龙高度等任务中的表现,展示了其复杂推理能力。不过,Willison也对模型在推理过程中推测的依据提出疑问,突显了模型推理逻辑的透明性和精确度仍有优化空间。
#阿里巴巴 #AI模型 #视觉推理 #QVQ-72B #开源技术
阅读更多:
https://qwenlm.github.io/blog/qvq-72b-preview/
AI 驱动科学
SIMPL2:药物研发的蛋白质相互作用检测利器
蛋白质-蛋白质相互作用是许多生物过程的核心,尤其与疾病的发生发展密切相关。然而,传统方法因高成本、复杂性等问题难以广泛应用。多伦多大学的研究团队开发了一种名为 SIMPL2 的新型检测平台,该平台基于分裂荧光素酶,优化了检测精度和流程效率。通过 SIMPL2,研究人员不仅能更好地理解这些相互作用,还为药物研发提供了关键技术支持。
研究团队改进了早期的 SIMPL 方法,采用三部分荧光素酶(tripart nanoluciferase, tNLuc)生成光信号,结合全液相操作极大地提高了检测灵敏度和操作简便性。SIMPL2 的检测流程仅需一步,可手动操作或自动化,适合高通量研究。实验显示,在一个参考蛋白质相互作用集的测试中,SIMPL2 的灵敏度和特异性均优于传统方法。
研究还表明,SIMPL2 可用于测量多种分子调节剂对蛋白质相互作用的调控,包括抑制剂、分子胶和 PROTAC。该平台能够高效检测弱相互作用,并支持快速验证新药物的有效性。研究团队还计划将其用于癌症等重大疾病的蛋白质相互作用研究,并结合量子计算和人工智能进一步优化药物设计。研究成果发表在 Molecular Systems Biology 期刊上。
#神经技术 #蛋白质相互作用 #药物发现 #高通量筛选
阅读更多:
Yao, Zhong, et al. “A Split Intein and Split Luciferase-Coupled System for Detecting Protein-Protein Interactions.” Molecular Systems Biology, Dec. 2024, pp. 1–19. embopress.org (Atypon), https://doi.org/10.1038/s44320-024-00081-2
微型机器人实现精准药物递送与实时成像
复杂生物流体环境中药物递送的精准性一直是医学领域的挑战。加州理工学院的研究团队利用双光子聚合技术,开发了一种基于水凝胶的微型机器人平台。这些机器人能够在复杂生物流体中运动,并实现高效药物递送与实时成像。研究表明,这种技术可以显著减少小鼠膀胱肿瘤体积。
研究采用了双光子聚合(Two-photon Polymerization,TPP)光刻技术,这是一种利用激光脉冲精准构建复杂微结构的技术。微型机器人外部亲水,内部疏水(hydrophilic and hydrophobic),通过化学修饰实现这种表面特性,使其能够捕获并稳定气泡,从而提高运动和超声成像效果。
机器人内含磁性纳米颗粒和治疗药物,可以通过外部磁场引导至目标部位。超声波振动使气泡产生推动力,同时增强成像对比度,便于实时监控。在动物实验中,微型机器人通过多次药物递送显著减少了小鼠膀胱肿瘤的体积。这种技术为精准药物递送和微创治疗提供了新思路。研究发表在 Science Robotics 上。
#神经技术 #精准医疗 #微型机器人 #药物递送
阅读更多:
Han, Hong, et al. “Imaging-Guided Bioresorbable Acoustic Hydrogel Microrobots.” Science Robotics, vol. 9, no. 97, Dec. 2024, p. eadp3593. science.org (Atypon), https://doi.org/10.1126/scirobotics.adp3593
变分自编码器的进化:LMMVAE如何破解数据依赖难题
变分自编码器(VAE)是一种强大的非线性降维工具,但传统方法假设数据观测值相互独立,无法充分捕捉数据中的空间、时间和聚类依赖性。为解决这一问题,以色列特拉维夫大学统计学系的 Giora Simchoni 和 Saharon Rosset 提出了LMMVAE模型,整合随机效应,将依赖性纳入VAE架构中。该方法显著改善了数据重构性能,展示了优越的实际应用效果。
LMMVAE模型的核心是结合了固定效应(fixed effects,通常假设变量独立)和随机效应(random effects,用于表示相似群组中的依赖关系)。研究人员通过对VAE的架构和损失函数进行修改,使其适应多种依赖结构,如空间、时间或聚类关系。在多个模拟数据集和真实数据集上的实验表明,与传统VAE相比,LMMVAE能够大幅降低平方重构误差(15%-30%)和负对数似然损失(10%-20%)。此外,在基于潜在表示的分类任务中,其准确率提升了5%-10%。研究的实验证明,LMMVAE在大规模表格数据和图像数据的降维和特征提取中具有广泛适用性。
#认知科学 #变分自编码器 #随机效应 #线性混合模型
阅读更多:
Simchoni, Giora, and Saharon Rosset. Integrating Random Effects in Variational Autoencoders for Dimensionality Reduction of Correlated Data. arXiv:2412.16899, arXiv, 24 Dec. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2412.16899
OpenAI o1模型:如何在智能化与安全性之间找到平衡
大型语言模型在生成自然语言内容和解决复杂问题方面显示出巨大潜力,但也带来安全性和内容合规的挑战。为应对这些问题,OpenAI团队开发了o1系列模型,通过引入思维链推理技术(Chain of Thought, CoT),显著提升了模型的智能化和安全性。研究采用强化学习方法,结合多样化数据集训练模型,最终展示出在内容安全性和复杂任务中的卓越表现。
研究的核心在于强化学习(Reinforcement Learning),通过公开、专有和内部生成的数据训练o1模型,使其掌握多步骤推理能力。这种能力使模型在复杂任务中表现更加出色,例如解答模糊问题和准确生成信息。研究团队还进行了全面安全评估,包括内容安全性、偏见性、幻觉生成率(hallucination rate,即模型生成虚假内容的概率)以及绕过攻击的抵御能力。
测试结果显示,o1模型在内容安全性方面能够更准确地拒绝不当请求,同时减少过度拒绝的发生;幻觉生成率较上一代模型大幅下降,显著提升了准确性。在处理偏见性问题时,模型更能应对模糊输入,生成可靠回答。在绕过攻击测试中,o1模型展现出卓越的鲁棒性,抵御成功率远超基线模型。然而,研究也发现,模型在某些复杂情况下(如隐性知识利用)仍存在改进空间。
#神经技术 #人工智能 #思维链 #强化学习
阅读更多:
OpenAI, et al. OpenAI O1 System Card. arXiv:2412.16720, arXiv, 21 Dec. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2412.16720
三张图像解锁个性化视觉新能力
个性化视觉任务因其数据稀缺和细粒度需求而极具挑战性。麻省理工学院、OpenAI 的研究人员 Shobhita Sundaram、Julia Chae 和 Yonglong Tian 等通过结合生成数据与对比学习方法,探索如何从少量实例图像中生成有效的个性化表示数据。他们的研究显著提升了个性化模型在多任务下的性能,提供了新的研究工具和评估标准。
研究提出了一种新的对比学习方法,结合文本到图像生成(T2I diffusion models),利用少量真实图像生成多样化的个性化合成数据来增强模型的表示能力。研究团队引入了一个全新的数据集 PODS(Personal Object Discrimination Suite),用于评估生成数据在分类(classification)、检索(retrieval)、检测(detection)和分割(segmentation)等任务中的表现。
实验结果显示,与传统方法相比,这种个性化表示在多种任务中均取得突破性进展。在分类任务中,基于三张真实图像生成的合成数据训练的模型准确率提升了约30%,而分割任务的性能也显著超过主流基准。这一方法特别强调了生成数据的质量与多样性对于提升模型性能的重要性。此外,研究还揭示了不同生成器的偏差在个性化任务中的具体影响,提供了重要的优化思路。
#神经技术 #个性化视觉 #生成模型 #对比学习
阅读更多:
Sundaram, Shobhita, et al. Personalized Representation from Personalized Generation. arXiv:2412.16156, arXiv, 20 Dec. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2412.16156
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。
热门跟贴