█ 脑科学动态
Science:人类视觉感知与想象共享同一套神经密码
我们如何在暗处看清事物?视网膜双极细胞网络的高度整合
一餐高脂饮食即可引发肠道关键免疫细胞迅速流失
全球夜间变暖威胁数十亿人睡眠健康
从嗅觉感知到精准转向:线虫全脑钙成像揭示导航底层机制
冥想仅需7分钟即可使脑电波变化达到峰值
连结感提升7%,为什么我们更愿意为直播而不是录播驻足?
宽恕可全面提升长期心理健康与亲社会性格
脑机接口超越医疗范畴:Neuralink技术或开启心理政治新纪元
█ AI行业动态
视频生成模型HappyHorse-1.0登顶评测榜首
█ AI驱动科学
破解AI过度自信:受大脑启发的噪声训练让神经网络找回“自知之明”
系统解析高通量筛选与AI技术,加速抗衰老药物研发
40万条帖子揭示减肥神药GLP-1的隐藏副作用
CompreSSM技术打造更精简、更快速的AI模型
PaperOrchestra问世,可将原始笔记自动撰写为AI研究论文
脑科学动态
Science:人类视觉感知与想象共享同一套神经密码
为什么我们在回忆曾见过的事物时它们会显得如此真实?视觉感知与心理想象是否共享大脑的基础架构?V. S. Wadia、Ueli Rutishauser和Doris Y. Tsao等研究人员(西达赛奈医疗中心和加州大学伯克利分校等)通过单神经元记录发现,人类大脑在感知和想象物体时激活了相同的神经元,揭示了视觉想象背后的共享神经编码机制。
该研究记录了16名植入颅内电极的癫痫患者大脑腹侧颞叶皮层中714个单神经元的电活动。研究人员首先让患者观看包含面部和动物等类别的图像,随后让部分患者凭记忆想象这些相同的图像。为了解析神经元信号,研究结合深度神经网络和生成式人工智能工具,为物体创建了数值描述。结果显示,在具有视觉反应的神经元中,约80%利用分布式轴编码(axis code,一种将刺激特征投射到特定特征轴上并根据投射值作出神经反应的编码方式)来表征物体。更关键的是,当患者想象这些物体时,约40%的轴调谐神经元被重新激活,并且精准重现了最初观看图像时的神经活动模式。这意味着心理意象的产生依赖于感知期间使用的相同感觉代码。这一发现不仅证实了人类腹侧颞叶皮层中存在生成模型,还可以通过神经元活动规律反向重建患者想象的画面。研究发表在 Science 上。
#神经科学 #神经机制与脑功能解析 #认知科学 #生成式AI #心理意象
阅读更多:
Wadia, V. S., et al. “A Shared Code for Perceiving and Imagining Objects in Human Ventral Temporal Cortex.” Science, vol. 392, no. 6794, Apr. 2026, pp. 207–15. science.org (Atypon), https://doi.org/10.1126/science.adt8343
我们如何在暗处看清事物?视网膜双极细胞网络的高度整合
视觉系统最初如何处理微弱光线下的信息?传统的并行处理假说认为视网膜中的信息通道是独立运作的。耶鲁大学医学院的Yao Xue、Seunghoon Lee和Z. Jimmy Zhou团队发现,视网膜中的神经通道远比想象中更加整合,一种层级化的网络机制揭示了人类在弱光下视物的关键。
▷ Credit: Neuron (2026).
研究团队摒弃了破坏突触回路的传统切片方法,在完整的鼠视网膜和人类视网膜中应用了双膜片钳技术与双光子成像。他们刺激特定的双极细胞(bipolar cells,负责接收感光细胞信号并向下游传递的中间神经元),并记录受体细胞反应。结果显示,双极细胞的十几个平行信息通道并非独立存在,而是通过电突触高度整合。刺激单个细胞会引发多个细胞释放神经递质,形成分散的云状信号网络。研究还发现BC6型双极细胞在网络中充当驱动节点,以层级方式向下游分配信号。这种串联网络使细胞能有效整合并处理微弱视觉信号,显著提升了对低对比度及微小目标的检测能力。研究发表在 Neuron 上。
#神经科学 #神经机制与脑功能解析 #视网膜 #视觉系统 #双极细胞
阅读更多:
Xue, Yao, et al. “A Hierarchical Electrical Synaptic Circuit Mechanism for Integrative Parallel Visual Processing in the Retina.” Neuron, vol. 0, no. 0, Feb. 2026. www.cell.com, https://doi.org/10.1016/j.neuron.2025.12.042
一餐高脂饮食即可引发肠道关键免疫细胞迅速流失
短期的油腻饮食究竟会如何快速重塑肠道微环境并影响免疫屏障?Eva C. Torrico和Selma Boulenouar等研究人员展开了详细探索,结果发现仅仅数小时的高脂饮食就足以对肠道内的关键免疫细胞造成致命打击,从而揭示了不良饮食习惯损害肠道健康的微观起始机制。
研究团队通过小鼠实验发现,喂食高脂饮食的小鼠肠道内3型先天淋巴细胞(ILC3,一种维持肠道健康的黏膜免疫卫士)在24小时内迅速衰减,且该现象与总热量摄入或体重增加无关。人类肠道样本分析同样显示超重人群的ILC3数量显著偏低。机制研究揭示,高脂饮食会带来致命的双重打击:一方面它增加肠道通透性,激活单核吞噬细胞释放炎症因子;另一方面,ILC3自身会大量吸收脂肪酸,但炎症信号抑制了过氧化物酶体增殖物激活受体α(PPARα,调节脂质代谢的核心转录因子),从而阻断了脂肪酸氧化(FAO,细胞内燃烧脂肪获取能量的代谢通路)。未能燃烧的脂质转化为过氧化物,破坏线粒体结构并诱发细胞凋亡。实验还表明,鱼油因具抗炎特性不会引发此类毒性,且小鼠在及时恢复正常饮食后,肠道免疫系统可重回健康状态。研究发表在 Immunity 上。
#疾病与健康 #疾病预防 #高脂饮食 #免疫细胞 #肠道微生态
阅读更多:
Torrico, Eva C., et al. “High-Fat Diet Causes Rapid Loss of Intestinal Group 3 Innate Lymphoid Cells through Microbiota-Driven Inflammation and Mitochondrial Stress.” Immunity, Mar. 2026. ScienceDirect, https://doi.org/10.1016/j.immuni.2026.02.014
全球夜间变暖威胁数十亿人睡眠健康
随着全球变暖导致夜间升温加剧,这一现象究竟如何影响全球人口的睡眠?Kelton Minor等(哥本哈根大学)通过对大量观测数据的回顾性分析发现,夜间高温正严重缩短全球数十亿人的睡眠时间,并指出当前学术界对气候脆弱地区人群的睡眠状况存在严重认知空白。
研究团队回顾了过去十多年来关于温度与睡眠关系的受控实验室实验与大规模自然实验,并结合可穿戴设备的数据,评估了环境热量对全球人群睡眠的具体影响。研究结果显示,人类睡眠对温度的反应呈非线性,夜间气温即使适度升高,也会显著缩短睡眠时间。例如当夜间气温达到约27°C时,每10万暴露人群中就会新增约9300人睡眠不足6小时。此外,人类建造的建筑环境往往会滞留热量,这使得炎热天气对睡眠的破坏不仅发生在当晚,更会持续数日,导致严重的睡眠剥夺累加。令人担忧的是,现有研究严重忽视了非洲和东南亚等气候脆弱且贫困的地区人群。研究警告称,随着全球进一步变暖,睡眠受损问题将加速恶化,仅靠空调等现有措施难以应对。团队呼吁成立全球工作组,将睡眠健康纳入城市规划与气候适应策略中。研究发表在 SLEEP 上。
#疾病与健康 #疾病预防 #气候变暖 #睡眠健康 #公共卫生
阅读更多:
Minor, Kelton, et al. “A Wake-up Call for a Global Climate and Sleep Task Force.” Sleep, Mar. 2026, p. zsag075. Silverchair, https://doi.org/10.1093/sleep/zsag075
从嗅觉感知到精准转向:线虫全脑钙成像揭示导航底层机制
动物如何将感官信息转化为具体的导航行动?Steven W. Flavell 和 Talya S. Kramer 及其团队(麻省理工学院皮考尔学习与记忆研究所)通过研究秀丽隐杆线虫在气味环境中的运动,精确绘制了大脑从感知气味到执行复杂转向行为的完整神经元活动图谱,揭示了感觉运动弧的底层机制。
该研究通过将线虫放置在具有不同气味梯度的环境中,利用定制显微镜和全脑钙成像技术,实时追踪了线虫运动时其大脑中100多个神经元的活动模式。研究显示,线虫并非随机游走,而是能执行精确的纠错转向。研究团队发现了一个由约10个神经元组成的特定序列,它们控制线虫完成前行、后退、转向至再次前行的连续动作。其中,SAA神经元负责整合气味信息并精准规划转向方向。此外,通过细胞特异性干扰技术,研究人员发现由RIM神经元释放的神经调节剂酪胺在这一过程中发挥着类似车辆换挡的关键协调作用。当敲除酪胺后,线虫的神经活动序列和导航行为会严重崩溃。这一发现展示了神经系统如何通过特定架构和神经调节机制将感觉线索转化为动作。研究发表在 Nature Neuroscience 上。
#神经科学 #神经机制与脑功能解析 #秀丽隐杆线虫 #导航行为 #神经调节剂
阅读更多:
Kramer, Talya S., et al. “Neural Sequences Underlying Directed Turning in Caenorhabditis Elegans.” Nature Neuroscience, Apr. 2026, pp. 1–17. www.nature.com, https://doi.org/10.1038/s41593-026-02257-5
冥想仅需7分钟即可使脑电波变化达到峰值
冥想究竟需要多长时间才能在神经层面上对大脑产生实质性的改变?印度国家精神卫生和神经科学研究所的Malipeddi Saketh和Bindu M Kutty等团队通过实时追踪脑电活动,发现只需两到三分钟,大脑就会开始发生显著的脑电波转变并在七分钟时达到峰值,且经验越丰富的人在峰值时的脑波强度越高。
▷ 冥想新手对照组的时间动态:本文展示了初次冥想者(冥想新手对照组,简称 CNT)在呼吸觉察冥想中的起效时间和时间动态。Credit: Mindfulness (2026).
在这项研究中,研究团队招募了28名无冥想经验者、33名新手和42名高级练习者,让他们进行10分钟的呼吸觉察冥想。受试者佩戴装有128个传感器的帽子进行脑电图测试,以追踪多个频率频段的时间动态变化。研究结果显示,无论经验多少,受试者大脑的电模式都在2到3分钟内开始发生转变:与平静和专注相关的α波和θ波以及与警觉相关的β1波显著上升;同时,与困倦相关的δ波和γ1波出现下降。这些变化在7到10分钟时达到最强。有趣的是,高级练习者虽然不一定比新手更快达到峰值,但他们的脑波强度要强得多,且在冥想开始30秒时就已经能观察到独特的神经电生理特征。这一发现表明,即便生活忙碌,仅需7分钟的简短冥想练习也能迅速调节认知与情绪。研究发表在 Mindfulness 上。
#认知科学 #大脑信号解析 #脑波动力学 #冥想 #心理健康
阅读更多:
Saketh, Malipeddi, et al. “Temporal EEG Signatures of Meditation Experience: Peak Brainwave Changes at 7 Minutes During Isha Yoga Breath Watching.” Mindfulness, Mar. 2026. Springer Link, https://doi.org/10.1007/s12671-026-02790-1
连结感提升7%,为什么我们更愿意为直播而不是录播驻足?
数字化时代人们亟需在虚拟空间中寻找真实的社交连结。Nofar Duani(南加州大学)、Alixandra Barasch(科罗拉多大学博尔德分校)和 Adrian F. Ward(德克萨斯大学奥斯汀分校)探究了直播与录播对观众心理的不同影响,发现仅仅确认视频是实时发生的,就能显著提升观众的连结感和参与度,证实了纯粹现场效应的存在。
该研究团队以业余音乐表演为实验背景,招募了3500名参与者开展了五项行为学实验。研究人员在不同平台上让参与者观看真实直播或录播视频,甚至向其展示完全相同的视频但改变了直播标签。结果显示,直播为观众带来了显著的现场感提升。具体而言,观看直播的参与者对表演者的连结感提升了7个百分点,喜爱度提高了5个百分点。同时观众不仅观看直播的时间更长,也更愿意关注和订阅创作者的频道。研究团队分析指出,这种效应的核心机制是临场感的大幅增强。值得注意的是,如果观众看不到表演者的面部轮廓,这种现场感就会被大幅削弱;而当观众认为自己是唯一的观看者时,建立的连结感反而会变得更为强烈。研究发表在 Journal of Marketing 上。
#认知科学 #其他 #直播流媒体 #临场感 #消费者行为
阅读更多:
Duani, Nofar, et al. “EXPRESS: The Liveness Lift: Viewing Live Streams Creates Connection and Enhances Engagement in Amateur Music Performances.” Journal of Marketing, Jan. 2026, p. 00222429261421488. SAGE Journals, https://doi.org/10.1177/00222429261421488
宽恕可全面提升长期心理健康与亲社会性格
今天选择原谅他人,一年后会带来更强的幸福感吗?哈佛大学定量社会科学研究所的Richard G. Cowden和Everett L. Worthington Jr.等研究人员分析了全球逾20万人的纵向数据,证实习惯性宽恕能显著改善个体的长期心理健康并增强亲社会性格。
这项研究基于全球繁荣研究(Global Flourishing Study,一项涵盖23个国家代表性样本的大型纵向项目)的两次跨年度调查数据。研究人员评估了逾20万名参与者的特质性宽恕,并在一年后考察了涵盖心理、社会、身体等维度的56项幸福感指标。数据分析表明,经常性宽恕不仅减轻了抑郁和焦虑等心理困扰,还显著促进了感恩和向善等意志层面的成长。其中,宽恕与心理健康及亲社会行为的正向关联最强,与身体健康的关联相对较弱。此外,这种效应呈现出明显的跨文化差异。以南非为例,尽管该国总体宽恕水平较高,但受高贫困率和犯罪率等现实环境制约,宽恕与幸福感的关联被大幅削弱;在普遍期望宽恕的文化中,其带来的心理益处也会相应降低。研究证实,宽恕是可经过刻意练习强化的心理干预手段,能在人群层面产生实质性的健康效益。研究发表在 npj Mental Health Research 上。
#疾病与健康 #心理健康与精神疾病 #特质性宽恕 #社会文化差异 #行为干预
阅读更多:
Cowden, Richard G., et al. “Longitudinal Associations of Dispositional Forgivingness with Multidimensional Well-Being: A Two-Wave Outcome-Wide Analysis in the Global Flourishing Study.” Npj Mental Health Research, vol. 5, no. 1, Jan. 2026, p. 3. www.nature.com, https://doi.org/10.1038/s44184-026-00187-5
脑机接口超越医疗范畴:Neuralink技术或开启心理政治新纪元
脑机接口技术直接读取大脑数据的能力,引发了关于新型权力控制的深刻担忧。Sergi Parellada、Ana Gálvez Mozo与Francisco Tirado Serrano(加泰罗尼亚开放大学与巴塞罗那自治大学)探讨了相关社会影响,指出Neuralink不仅是医疗工具,更是将心理过程转化为数据以调控人类行为的心理政治项目,对个人自主权构成潜在威胁。
该研究借用已有理论,利用内容分析软件Atlas.ti(一种定性数据分析工具,用于处理文本与音频等非结构化数据)将Neuralink作为案例进行深入分析。研究显示,诸如社交媒体等日常应用已在使用心理政治原理,但Neuralink由于能直接读取大脑数据,可以绕过意识层面,直接影响无意识的认知过程。
研究团队明确指出了该技术带来的四大风险。首先是个人自主性的丧失,系统将取代个人做出改善行为的决定。其次是心理过程的商品化,神经数据将变为新的经济资源。第三是心理健康的外包,个人的心理福祉将被交由私营公司控制的设备管理。最后是让个人生物学地适应系统,即将政治焦点从解决引发不满的社会条件转移到直接修改大脑机制以适应环境。研究认为,这是一种新的治理形式,它不再通过强制手段,而是利用算法预测和自动化来将思想转化为生产资源。研究呼吁在面对神经技术时保持人类的反思能力,并促进技术透明度。研究发表在 Culture, Theory and Critique 上。
#意识与脑机接口 #脑机接口 #心理政治学 #神经数据商品化 #科技伦理
阅读更多:
Guillamón, Sergi Parellada, et al. “Neuralink and the Rise of Psychopolitical Governmentality.” Culture, Theory and Critique, vol. 0, no. 0, Dec. 2025, pp. 1–18. Taylor and Francis+NEJM, https://doi.org/10.1080/14735784.2025.2582471
AI 行业动态
阿里ATH官方认领神秘「欢乐马」:视频生成模型HappyHorse-1.0登顶评测榜首
在知名AI评测分析平台Artificial Analysis上,一个代号为「HappyHorse-1.0」的视频生成模型突然空降榜首,引发社区广泛猜测。如今,这只“欢乐马”被正式认领:它来自阿里巴巴旗下AI核心事业群ATH(Alibaba Token Hub,阿里新成立的聚焦人工智能技术和产品的事业群)郑波团队。据官方介绍,HappyHorse目前处于内测阶段,计划于4月30日开放API,并作为ATH创新事业部探索AI时代全新交互方式的一部分。该模型在文本生成视频和图像生成视频两类任务中均支持生成原生音频,并在所有评测排行榜上位居第一或第二,将字节跳动的Seedance 2.0等竞品挤至身后。
此次认领也揭开了幕后团队的面纱。郑波现任阿里巴巴副总裁,拥有清华大学计算机博士学位,曾领导谷歌展示广告算法与中国地图团队,2017年加入阿里后历任淘宝搜推算法负责人、阿里妈妈CTO等职,研究方向涵盖大模型与多模态。尽管模型表现出色,但官方尚未开放内测体验。Artificial Analysis平台确认,HappyHorse-1.0在“无音频”榜单中稳居第一,“有音频”榜单中Elo分数(竞技水平评分)几乎与字节的Dreamina Seedance 2.0持平。这一消息让AI社区对阿里在视频生成领域的布局充满期待。
#欢乐马 #HappyHorse #阿里ATH #视频生成模型 #郑波团队
阅读更多:
https://huggingface.co/happyhorse-lab/Happy-Horse-1.0-AI-Video-Generator
AI 驱动科学
破解AI过度自信:受大脑启发的噪声训练让神经网络找回“自知之明”
深度学习模型在实际应用中常表现出过度自信,导致输出不准确甚至产生幻觉,而传统的初始化方法正是这一问题的根源。Jeonghwan Cheon和Se-Bum Paik引入了一种受神经发育启发的随机噪声热身策略,成功解决了模型的不确定性校准问题,让网络在面对未知数据时能够保持客观真实的置信度。
生物大脑在出生前会通过自发神经活动进行预学习,受此机制启发,研究团队提出了一种随机噪声热身训练方法。在该方法中,神经网络在接触真实维度的数据之前,首先接受由高斯分布生成的随机噪声和均匀分布的随机标签的短暂训练。研究人员在多种不同复杂度的网络架构中测试了这一方法。实验结果显示,传统的深度学习随机初始化方法会使网络在初始阶段对特定的输出类别产生偏见并表现出过度自信。而通过随机噪声热身训练,网络能够将初始置信度调整至偶然水平,实现完美的初始预校准。在随后的真实数据学习中,这种预校准使得网络的预测置信度与实际准确率保持高度一致,且完全不会牺牲原有的测试性能。此外,经过该方法训练的网络在面对未见过的分布外样本时,会表现出接近偶然水平的极低置信度,从而显著提升了人工智能系统识别未知输入的能力。研究发表在 Nature Machine Intelligence 上。
#大模型技术 #计算模型与人工智能模拟 #不确定性校准 #随机噪声 #认知科学
阅读更多:
Cheon, Jeonghwan, and Se-Bum Paik. “Brain-Inspired Warm-up Training with Random Noise for Uncertainty Calibration.” Nature Machine Intelligence, Apr. 2026, pp. 1–12. www.nature.com, https://doi.org/10.1038/s42256-026-01215-x
系统解析高通量筛选与AI技术,加速抗衰老药物研发
随着全球老龄化,如何延长健康生活年限成为紧迫挑战。传统抗衰药物研发缓慢且昂贵,南方科技大学的吕宇轩、电子科技大学的鲜波、澳门科技大学的朱健康等人联合国内外多家机构,系统综述并提出了一套整合了短寿命模型、自动化筛选与人工智能的抗衰老药物发现新范式,旨在加速“长寿药”从实验室到临床的转化。
该研究团队提出的新范式摒弃了传统耗时过长的动物模型,转而聚焦于秀丽隐杆线虫、果蝇和非洲鳉鱼这三种与人类衰老机制高度相似的短寿命生物。通过结合WormBot等自动化高通量筛选平台,研究人员能够对成千上万个样本进行全生命周期的自动化监控,将评估标准从单纯的“寿命延长”转向更具临床意义的“健康改善”,如肠道完整性、认知功能等。人工智能技术则贯穿整个流程,不仅用于前期数亿分子的虚拟筛选,还负责后续海量表型数据的深度分析与机制推断。此外,文章还强调了“反向转化”策略的潜力,即将在临床上观察到具有抗衰老效果的药物(如二甲双胍),利用该高效平台迅速验证其作用机制,从而加速老药新用。研究发表在 Ageing Research Reviews 上。
#疾病与健康 #自动化科研 #AI驱动科学 #健康管理与寿命延长
阅读更多:
Ji, Xingkun, et al. “High-Throughput Screening for Ageing and Age-Related Disease Drug Discovery: Advances and Challenges.” Ageing Research Reviews, Apr. 2026, p. 103124. ScienceDirect, https://doi.org/10.1016/j.arr.2026.103124
40万条帖子揭示减肥神药GLP-1的隐藏副作用
广受欢迎的GLP-1类减肥和糖尿病药物是否存在未被发现的副作用?宾夕法尼亚大学的Sharath Chandra Guntuku, Lyle Ungar, Neil K. R. Sehgal, Jena Shaw Tronieri等研究人员利用人工智能分析了超过40万条社交媒体帖子,结果识别出了一些可能在临床试验中被忽视的患者报告症状,特别是月经不调和体温异常。
▷ 研究人员分析 Reddit 帖子的过程特写:左侧是研究人员输入人工智能分析系统的帖子类型示例,右侧展示了部分分析结果。Credit: Sylvia Zhang
研究团队开创性地使用大型语言模型,对近7万名Reddit用户在六年间发布的关于索玛鲁肽和替라帕肽的帖子进行“计算社会聆听”(computational social listening)。该方法首先通过识别恶心、呕吐等已知的胃肠道不适验证了其准确性,这些是用户最常报告的副作用。在此基础上,AI模型进一步挖掘出了两类值得关注的新信号:近4%报告副作用的用户提到了生殖系统症状,包括月经周期不规律和异常出血;另一部分用户则报告了发冷、潮热等体温调节问题。此外,疲劳是用户中第二大常见主诉,其报告频率远高于临床试验。研究人员强调,这些发现是相关性的而非因果性的,但它们为药物的真实世界安全状况提供了宝贵线索,并提示临床医生应关注这些患者关心的问题。研究发表在 Nature Health 上。
#疾病与健康 #自动化科研 #药物警戒 #社交媒体分析 #GLP-1药物
阅读更多:
Sehgal, Neil K. R., et al. “Self-Reported Side Effects of Semaglutide and Tirzepatide in Online Communities.” Nature Health, Apr. 2026, pp. 1–6. www.nature.com, https://doi.org/10.1038/s44360-026-00108-y
训练与压缩同步进行:CompreSSM技术打造更精简、更快速的AI模型
传统AI模型训练面临成本与性能的权衡困境。为解决此问题,来自麻省理工学院计算机科学与人工智能实验室(CSAIL)、马克斯·普朗克智能系统研究所等机构的Makram Chahine, Philipp Nazari, Daniela Rus, T. Konstantin Rusch等人,开发了一种名为CompreSSM的新技术。该技术能在训练过程中动态压缩模型,实现了在保持高性能的同时,显著提升训练速度和效率。
该团队提出的CompreSSM方法,颠覆了先训练后压缩的传统模式,将压缩过程融入学习本身。该技术专门针对状态空间模型,一类在语言处理和机器人等领域表现出色的AI架构。研究人员借鉴了控制理论中的数学工具——汉克尔奇异值(Hankel singular values),它能衡量模型内部各状态对整体行为的贡献度。研究发现,这些状态的相对重要性在训练开始约10%后就趋于稳定。据此,CompreSSM可以在训练早期精准识别并“手术式”地移除冗余组件,让剩余的训练在更精简、更高效的模型上完成。实验结果十分显著:在图像分类基准测试中,压缩后的模型在保持近乎同等准确率的同时,训练速度提升了1.5倍。例如,在CIFAR-10数据集上,一个状态维度被压缩至约四分之一的模型,准确率达到85.7%,远高于从头训练的同尺寸小模型(81.8%)。在流行的Mamba架构上,该方法更是实现了约4倍的训练加速,将128维模型压缩至12维,性能依旧具有竞争力。该方法在效率和最终性能上均优于知识蒸馏等现有技术。研究成果将在 International Conference on Learning Representations 上发表。
#大模型技术 #其他 #模型压缩 #状态空间模型
阅读更多:
Chahine, Makram, et al. “The Curious Case of In-Training Compression of State Space Models.” arXiv:2510.02823, arXiv, 24 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2510.02823
AI智能体PaperOrchestra问世,可将原始笔记自动撰写为AI研究论文
如何将零散的研究思路和实验数据自动转化为一篇完整的学术论文?谷歌研究员Yiwen Song, Yale Song, Tomas Pfister和Jinsung Yoon为此开发了PaperOrchestra,一个创新的多智能体框架。该系统不仅能自主撰写论文,还在与同类工具的对比中展现出卓越的文献综述和稿件整合能力。
PaperOrchestra采用一个协同工作的多智能体框架,模拟人类的写作流程。它首先由“大纲智能体”解析用户提供的想法摘要和实验日志,规划文章结构、图表设计和文献检索策略。随后,“绘图智能体”和“文献综述智能体”并行工作,分别负责生成概念图、数据图,以及检索、筛选并整合相关文献。最后,“章节写作智能体”和“内容优化智能体”将所有材料整合成一篇完整的latex手稿,并模拟同行评审过程进行迭代修改,直至达到可提交标准。为客观评估其性能,团队还构建了首个AI论文写作基准PaperWritingBench。在人类评估中,PaperOrchestra在文献综述质量上的胜率比基线高出50%-68%,整体稿件质量高出14%-38%,证明了其在自动化科研写作领域的巨大潜力。
#AI驱动科学 #自动化科研 #大模型技术
阅读更多:
Song, Yiwen, et al. “PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing.” arXiv:2604.05018, arXiv, 6 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.05018
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。
研究院还建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。
热门跟贴