脑科学动态

科学家首次绘制视网膜"刹车系统"图谱,揭示视觉调控新机制

炎症可能是慢性疼痛和抑郁症之间的联系

大脑如何学会"自动屏蔽"高频干扰

右额叶受损,你的逻辑思维会下降15%

野火过后,他们的大脑被"卡"在了灾难时刻

名词比形容词更好记?重复阅读时学习速度的加快

告别"数字痴呆"焦虑:老年人用科技反而更清醒

"听见"世界的形状:AI眼镜为视障者打造三维感知

AI行业动态

开源模型HiDream-I1,挑战图像生成霸主地位

Gamma 2.0,AI一键搞定PPT、网站和社媒

Google AI Studio免费开放Veo 2

OpenAI发布开源本地编码代理Codex CLI

OpenAI发布其最新推理模型o3和o4-mini

AI驱动科学

比AlphaFold更懂"坏蛋白",新AI工具预测老年痴呆元凶结构

大脑视觉通路新发现:腹侧流可能兼具空间感知功能

人类如何在没有数字的情况下做出决策

训练LLMs自我净化语言

社交网络易受AI操纵加剧极化现象

AI做加法也"作弊"?科学家戳破大模型的数学泡沫

MineWorld:基于Minecraft的实时交互式世界模型

脑科学动态

科学家首次绘制视网膜"刹车系统"图谱,揭示视觉调控新机制

视觉如何实现精准调控?DANDRITE研究所的Keisuke Yonehara团队与美国合作者利用新型GABA传感器,首次完整绘制了视网膜中44种抑制性神经元的功能图谱,发现它们通过精密的空间组织调控视觉信号处理,为理解先天性眼球震颤等疾病提供新视角。

左:视网膜图片;右:通过 GFP 可视化的 GABA 能细胞类型。Credit: Nature Neuroscience (2025).

研究团队采用iGABASnFR2传感器(实时监测GABA释放的荧光标记),对小鼠视网膜内丛状层进行双光子成像。通过设计多种光刺激模式,他们捕捉到44种GABA能无长突细胞(amacrine cells,视网膜内抑制性中间神经元)的动态响应,其中部分细胞类型此前从未被描述。这些神经元展现出惊人的系统性:其突触输入和输出位点沿特定视网膜方向精确排列,形成类似"高效交通网"的结构。例如,某些细胞专门编码垂直运动,另一些则偏好水平运动,这种分工使大脑能精准解析视野中的运动方向。

实验还显示,不同类型的GABA释放时间存在显著差异,从毫秒级到秒级不等,这种"多时间尺度调控"使视网膜能同时处理快速移动和静态物体。该发现不仅解释了视觉信号的并行处理机制,更揭示了先天性眼球震颤(一种与GABA失衡相关的眼疾)可能的神经基础。研究发表在 Nature Neuroscience 上。

#神经科学 #神经机制与脑功能解析 #视觉科学 #神经调控 #视网膜疾病

阅读更多:

Matsumoto, Akihiro, et al. “Functionally Distinct GABAergic Amacrine Cell Types Regulate Spatiotemporal Encoding in the Mouse Retina.” Nature Neuroscience, Apr. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41593-025-01935-0

炎症可能是慢性疼痛和抑郁症之间的联系

慢性疼痛与抑郁症为何常相伴而生?耶鲁大学医学院的Rongtao Jiang、Dustin Scheinost团队通过分析43万人数据发现,身体疼痛部位越多,抑郁风险越高,而C反应蛋白等炎症标志物是连接二者的关键"桥梁"。

研究工作流程概述。 Credit: Science Advances (2025).

研究团队利用英国生物样本库(UK Biobank)14年追踪数据,首次构建复合疼痛评分系统,量化头部、背部等8个部位的急/慢性疼痛影响。结果显示,相比无痛者,单部位疼痛者抑郁风险增加1.4倍,而4处以上疼痛者风险飙升至3.2倍。通过孟德尔随机化(Mendelian randomization,一种利用遗传变异推断因果关系的方法)证实疼痛可能直接导致抑郁。血液分析发现,C反应蛋白(CRP,肝脏在炎症反应中产生的蛋白质)水平升高可解释12.7%的关联强度,其影响超过血小板和白细胞等指标。进一步脑成像显示,疼痛患者的前扣带皮层(与情绪调控相关的脑区)活动异常。该发现为"抗炎疗法预防抑郁"提供了理论依据,未来或可通过监测CRP筛查高危人群。研究发表在 Science Advances 上。

#疾病与健康 #心理健康与精神疾病 #疼痛 #炎症机制 #脑身连接

阅读更多:

Jiang, Rongtao, et al. “The Inflammatory and Genetic Mechanisms Underlying the Cumulative Effect of Co-Occurring Pain Conditions on Depression.” Science Advances, vol. 11, no. 14, Apr. 2025, p. eadt1083. science.org (Atypon), https://doi.org/10.1126/sciadv.adt1083

大脑如何学会"自动屏蔽"高频干扰

为什么我们会对频繁出现的广告"视而不见"?莱比锡大学的Norman Forschack与阿姆斯特丹自由大学的Dock H. Duncan团队发现,大脑视觉系统能在100毫秒内自动抑制熟悉干扰,这种"神经过滤器"可提高21%的任务表现。

一位戴着允许在头皮上 64 个位置同时测量电压的脑电图帽的受试者。Credit: Peter Valckx, Vrije Universiteit Amsterdam

研究采用脑电图(EEG)技术中的稳态视觉诱发电位(SSVEP,通过特定频率闪烁刺激诱发可追踪的脑电信号)和事件相关电位(ERP)双指标,记录了24名参与者在完成视觉搜索任务时的神经活动。实验中,红色菱形干扰物75%概率出现在固定位置,要求被试在绿色图形中定位目标圆圈。数据分析显示,仅经过20分钟训练,大脑就能在视觉处理最初100毫秒内开始抑制高频干扰位置,SSVEP振幅在该位置显著降低37%。

更令人惊讶的是,当目标意外出现在"干扰习惯位置"时,其神经响应也会减弱15%,证明这种抑制具有空间特异性而非特征选择性。行为数据证实,干扰物出现在学习位置时,被试搜索准确率比随机位置提高21%。研究为理解注意力自动化机制提供了新证据,对交通标志设计等现实场景具有启示意义。研究发表在 The Journal of Neuroscience 上。

#神经科学 #神经机制与脑功能解析 #注意力机制 #视觉处理 #脑电图技术

阅读更多:

Duncan, Dock H., et al. “Learning Modulates Early Encephalographic Responses to Distracting Stimuli: A Combined SSVEP and ERP Study.” Journal of Neuroscience, Apr. 2025. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.1973-24.2025

右额叶受损,你的逻辑思维会下降15%

伦敦大学学院皇后广场神经病学研究所和UCLH神经心理学系的Joseph Mole、James K Ruffle等团队通过研究247名脑损伤患者发现,右额叶是推理能力的核心区域,其损伤会导致错误率显著上升15%,并开发出两种新型临床检测工具。

研究采用损伤-缺陷映射(lesion-deficit mapping,通过分析脑损伤部位与认知缺陷的对应关系)技术,对比247名单侧脑损伤患者与81名健康人的表现。团队特别设计了口头类比推理测试(ART,如"如果A比B聪明,A比C聪明,那么B比C聪明吗?")和非言语演绎推理测试(DRT,如"1,2,3最类似5,6,7还是6,5,7?")。通过非参数贝叶斯随机块模型(一种能识别脑网络社区结构的先进算法)分析发现,右额叶构成独立的功能网络,该网络损伤会同时影响推理和流体智力(Gf,解决新问题的能力)。新测试对临床诊断右额叶功能障碍具有重要价值,计划在NHS推广。研究发表在 Brain 上。

#神经科学 #神经机制与脑功能解析 #认知科学 #计算模型与人工智能模拟

阅读更多:

Mole, Joseph, et al. “A Right Frontal Network for Analogical and Deductive Reasoning.” Brain, Apr. 2025, p. awaf062. Silverchair, https://doi.org/10.1093/brain/awaf062

野火过后,他们的大脑被"卡"在了灾难时刻

火灾幸存者为何更难做出明智选择?加州大学圣地亚哥分校的Jyoti Mishra团队发现,直接经历2018年加州坎普大火的幸存者大脑后扣带回皮层(PCC)活动异常增强,导致其长期决策能力受损,即使灾后一年仍无法优先选择高收益选项。

研究团队通过货币奖励决策任务结合脑电图(EEG)技术,对比分析75名参与者(直接暴露组27人、间接暴露组21人、对照组27人)。结果发现,直接暴露组在任务中表现出显著的"赢-留"(Win-Stay)行为缺陷——选择长期高收益选项的概率比对照组低23%。脑电溯源分析揭示,这种决策障碍与后扣带回皮层(PCC,负责深度思考的脑区)的过度激活相关,表明幸存者陷入"反复思考却无法行动"的认知僵局。仅目睹灾害的间接暴露组认知功能基本正常,提示气候创伤对大脑的影响需要直接身体接触性暴露。该研究首次为气候相关的心理健康干预提供了可量化的神经认知标志物,建议通过正念训练抑制PCC过度活动。研究发表在 Scientific Reports 上。

#疾病与健康 #心理健康与精神疾病 #神经机制与脑功能解析 #气候创伤 #决策障碍

阅读更多:

Nan, Jason, et al. “Climate Trauma from Wildfire Exposure Impacts Cognitive Decision-Making.” Scientific Reports, vol. 15, no. 1, Apr. 2025, p. 11992. www.nature.com, https://doi.org/10.1038/s41598-025-94672-0

名词比形容词更好记?重复阅读时学习速度的加快

重复阅读时速度加快,是加速学习,还是一种厌倦?查尔斯大学艺术学院的Jan Chromý和Fabian Tomaschek团队通过1,500人实验证明,这种"任务适应"现象本质是大脑的策略性学习——参与者不仅读得更快,还能更精准抓取关键信息。

研究设计6项创新性自定步调阅读实验(self-paced reading,参与者按键逐词阅读),摒弃传统填充句和选择题,采用开放式问题捕捉真实学习效果。数据显示,随着试验推进,参与者阅读速度提升35%,对名词的回忆准确率(recall accuracy)比形容词高28%,尤其擅长抓取高频被提问的信息类型。通过线性混合模型(linear mixed-effects model)分析发现,大脑会像优化算法般重新分配注意力资源,对任务关键信息投入更多认知资源。这种学习效应在无外部激励时依然存在,证实速度提升并非源于动机下降。研究为教育领域的刻意练习(deliberate practice)提供了神经认知依据。研究发表在 Open Mind 上。

#认知科学 #神经机制与脑功能解析 #任务适应 #阅读理解 #注意力分配

阅读更多:

Chromý, Jan, and Fabian Tomaschek. “Learning or Boredom? Task Adaptation Effects in Sentence Processing Experiments.” Open Mind, vol. 8, Dec. 2024, pp. 1447–68. Silverchair, https://doi.org/10.1162/opmi_a_00173

告别"数字痴呆"焦虑:老年人用科技反而更清醒

数字技术是否损害老年认知?德克萨斯大学的Jared F. Benge和贝勒大学的Michael K. Scullin团队通过分析41.1万人的数据发现,50岁以上人群使用数字技术反而与58%的认知衰退风险降低相关,推翻了"数字痴呆"的流行假说。

研究团队对57项纵向研究进行荟萃分析,涵盖来自8个数据库的41.1万名50岁以上成年人数据,平均跟踪6.2年。通过计算综合风险比(odds ratio)发现,经常使用电脑、智能手机和互联网的老年人认知衰退风险显著降低(OR=0.42),相当于风险下降58%。这种保护作用独立于社会经济地位和健康状况,且效果优于已知的保护因素——比体育锻炼(约35%风险降低)和血压控制(约13%)更显著。研究提出"技术储备"假说,认为适应新软件、学习使用智能设备等行为可能像"大脑体操"一样维持认知活力。不过研究者强调,该结果不适用于被动屏幕时间(如刷社交媒体),且中低收入国家数据不足。研究发表在 Nature Human Behaviour 上。

#疾病与健康 #健康管理与寿命延长 #认知科学 #数字技术 #老龄化

阅读更多:

Benge, Jared F., and Michael K. Scullin. “A Meta-Analysis of Technology Use and Cognitive Aging.” Nature Human Behaviour, Apr. 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41562-025-02159-9

"听见"世界的形状:AI眼镜为视障者打造三维感知

全球超10亿视障者面临辅助设备适配难题,上海交通大学顾磊磊团队开发出融合柔性电子与AI的可穿戴系统,通过听觉触觉替代视觉,显著提升导航效率并降低认知负荷。

摄像头目前安装在眼镜上,但该团队正在努力使这些设备更轻便、更隐蔽。

研究团队设计了一款集成深度摄像头(D435i)的智能眼镜,配合骨传导耳机和柔性电子皮肤(A-skin,含ToF传感器和磁致动器),将视觉信息转化为三维空间提示音(3D spatial audio)和振动反馈。独创的元宇宙训练平台(VR training system)通过Unity构建虚拟场景,配合自供电智能鞋垫(利用摩擦发电原理)实现虚实运动同步。在20名视障者测试中,系统使迷宫导航效率提升25%,碰撞率降低40%,可用性评分达79.6分(超过85%商业设备)。柔性电子皮肤采用PDMS基底和银颗粒电路,兼具透气性与高灵敏度,而模块化设计支持开源适配。研究发表在 Nature Machine Intelligence 上。

#疾病与健康 #跨学科整合 #个性化医疗 #可穿戴技术 #人机交互

阅读更多:

Tang, Jian, et al. “Human-Centred Design and Fabrication of a Wearable Multimodal Visual Assistance System.” Nature Machine Intelligence, Apr. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s42256-025-01018-6

AI 行业动态

开源模型HiDream-I1,挑战GPT-4o与Midjourney图像生成霸主地位

近日,智象未来推出的开源图像生成模型HiDream-I1引发全球科技圈关注。该模型基于自研的Sparse DiT(稀疏扩散变换器)架构,结合混合专家(MoE)机制,能够高效处理复杂文本指令并生成高质量图像。其开源的三个版本(Full/Dev/Fast)分别针对画质与速度优化,最快5秒即可出图。在多项基准测试中,HiDream-I1表现亮眼,尤其在写实风格、亚洲人物特征还原及材质细节处理上优势显著。

在实际测试中,HiDream-I1与GPT-4o、Midjourney V7同台竞技。结果显示,HiDream在场景构图、光影层次和本土化审美(如亚洲女性形象)上更胜一筹,但在创意延展性和动态表现上稍逊。例如,它能精准呈现股票交易员的悲伤神态,却难以完全捕捉运动场景的活力感。此外,模型对中文提示词的理解优于英文,偶尔会出现误译问题。

技术层面,HiDream通过“扩散模型+GAN增强”技术提升图像锐度与细节,并采用知识蒸馏压缩模型体积。未来,智象未来计划推出支持语音修图的HiDream-E1和多模态交互的HiDream-A1。尽管目前HiDream在艺术创造力上不及对手,但其在商业设计、广告视觉等务实场景中已展现出强大潜力,为开源生态提供了新的高性能选择。

#开源模型 #图像生成 #AI绘画 #多模态 #中国科技

阅读更多:

https://huggingface.co/collections/HiDream-ai/hidream-i1-67f3e90dd509fed088a158b3

Gamma 2.0来了!AI一键搞定PPT、网站和社媒,设计小白也能秒变大神

Gamma近日正式推出升级版Gamma 2.0平台,这是一款集网站构建、演示文稿制作和社交媒体设计于一体的AI工具。用户仅需输入简单描述,平台便能在几十秒内生成高质量内容,无需切换多个工具。Gamma 2.0支持演示文稿、网站、社交媒体内容及文档的快速生成,并能智能识别品牌元素、编辑图像、生成图表,同时提供多种导出格式,成为多场景创作的利器。

该平台功能强大且操作简便。用户可通过提示词或对话方式创建内容,上传品牌文件后自动识别颜色和字体,无需手动设置规范。图像编辑功能支持更换主体、变换风格及去除背景,图表和排版工具则能根据数据或提示词生成专业效果。Gamma 2.0还支持导出为PDF、PowerPoint等格式,或直接发布至LinkedIn,大幅缩短内容制作时间,从数小时缩减至几分钟。

数据显示,Gamma用户已突破5000万,每天生成70万份演示文稿和400万张AI图片。新版本还优化了团队协作功能,并推出全新UI界面。付费Pro版提供无限AI生成、自定义域名等高级功能,而免费版适合个人用户尝鲜。

#AI工具 #内容生成 #演示文稿 #品牌设计 #多场景创作

阅读更多:

https://gamma.app/

Google AI Studio免费开放Veo 2!手把手教你用提示词生成高质量视频

Google AI Studio近日宣布免费开放Veo 2的访问权限,这意味着开发者和创作者可以零成本体验这一先进的视频生成工具。用户能够直接在平台上测试提示词、调整视频宽高比和持续时间等参数,并实时查看生成效果,极大简化了调试流程。Google还贴心地提供了详细的提示词编写建议,帮助用户快速上手并提升视频质量。

为了生成更精准的视频内容,Google建议提示词应注重清晰度和细节。例如,明确描述视频主题、主体动作、背景环境、镜头角度、灯光效果以及整体风格或情绪。避免使用模糊的术语,而是通过具体描述让AI更准确地理解创作意图。这种结构化提示方法不仅能提高视频的丰富度,还能让生成内容更符合预期。

#GoogleAI #Veo2 #视频生成 #提示词技巧 #AI工具

阅读更多:

https://developers.googleblog.com/en/veo-2-video-generation-now-generally-available/

OpenAI发布开源本地编码代理Codex CLI

OpenAI发布了Codex CLI,这是一款开源的本地编码代理,旨在将自然语言指令直接转换为可执行的代码。该工具支持多种编程语言,包括Python、JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript和Shell等,允许开发者在本地环境中使用自然语言进行编程操作。Codex CLI的推出,标志着自然语言与编程语言之间的界限进一步模糊,为开发者提供了更加直观和高效的编码方式。

在实际应用中,Codex CLI允许用户通过简单的自然语言指令,完成代码的生成、编辑和执行等操作。例如,用户可以输入“创建一个包含侧边菜单和顶部标题的页面”,Codex CLI将自动生成相应的HTML和CSS代码,构建出符合要求的网页结构。此外,Codex CLI还支持语音输入,使得用户可以通过语音指令进行编程操作,进一步提升了工具的易用性和交互性。值得注意的是,Codex CLI在执行过程中,能够根据用户的指令,实时生成并执行代码,实现了从自然语言到代码的无缝转换。这一特性,使得非专业开发者也能通过简单的自然语言指令,完成复杂的编程任务,降低了编程的门槛。

#OpenAI #人工智能 #自然语言处理 #代码生成 #开源工具

阅读更多:

https://www.marktechpost.com/2025/04/16/openai-releases-codex-cli-an-open-source-local-coding-agent-that-turns-natural-language-into-working-code/

OpenAI发布其最新推理模型o3和o4-mini

OpenAI于2025年4月16日发布了其最新的推理模型o3和o4-mini,标志着在人工智能多模态理解和工具自主使用方面迈出了关键一步。这两款模型不仅在编程、数学和视觉任务中表现出色,还能自主调用ChatGPT内的各种工具,如网页搜索、Python代码执行、图像分析与生成以及文件解读等,显著提升了复杂任务的处理能力。其中,o3被誉为OpenAI迄今最强大的推理系统,而o4-mini则以更小的体积和更低的成本,在数学、编码和视觉任务上展现出卓越性能。这两款模型已向ChatGPT Plus、Pro和Team用户开放,未来还将扩展至更多用户群体。

在研究方法上,o3模型通过引入图像理解能力,能够分析图像、图表和图形等视觉输入,提升了在复杂任务中的表现。在多个基准测试中,o3在Codeforces、SWE-bench和MMMU等评估中设定了新的标准,尤其在编程、商业咨询和创意构思等领域表现突出。专家评估显示,o3在处理复杂现实任务时,重大错误率比前代模型o1减少了20%。o4-mini则作为一款优化了速度和成本的小型模型,在数学、编码和视觉任务上展现出卓越性能。在AIME 2024和2025的评估中,o4-mini取得了优异成绩,专家评估也显示其在非STEM任务和数据科学等领域优于前代模型o3-mini。得益于其高效性,o4-mini支持比o3更高的使用限制,成为高容量、高吞吐量任务的理想选择。

#OpenAI #人工智能 #图像理解 #工具自主使用 #智能代理

阅读更多:

https://openai.com/index/introducing-o3-and-o4-mini/

AI 驱动科学

比AlphaFold更懂"坏蛋白",新AI工具预测老年痴呆元凶结构

淀粉样蛋白错误折叠如何导致神经退行性疾病?长平实验室的Mingchen Chen和莱斯大学的Peter Wolynes团队开发了AI工具RibbonFold,成功预测淀粉样蛋白多形态结构,揭示了疾病进展的关键机制。

RibbonFold 的示意图。 Credit: Proceedings of the National Academy of Sciences (2025).

研究团队改造AlphaFold2框架,新增针对淀粉样纤维的平行排列约束(蛋白质链对齐规则)和多态性损失函数,使RibbonFold能捕捉错误折叠蛋白的复杂构象。通过分析能量景观(蛋白质稳定性图谱),发现淀粉样纤维会随时间从可溶态转变为不溶态,这种动态过程解释了为何症状常在晚年出现。在独立测试中,RibbonFold的TM-score达0.5,远超现有工具。该成果不仅为靶向治疗提供精确结构模板,还可能启发新型生物材料设计。研究发表在 PNAS 上。

#疾病与健康 #预测模型构建 #AI驱动科学 #神经退行性疾病 #蛋白质折叠

阅读更多:

Guo, Liangyue, et al. “Generating the Polymorph Landscapes of Amyloid Fibrils Using AI: RibbonFold.” Proceedings of the National Academy of Sciences, vol. 122, no. 16, Apr. 2025, p. e2501321122. pnas.org (Atypon), https://doi.org/10.1073/pnas.2501321122

大脑视觉通路新发现:腹侧流可能兼具空间感知功能

传统认为专司物体识别的大脑腹侧视觉通路可能另有玄机。麻省理工学院Yudi Xie、James J. DiCarlo团队通过人工智能模型发现,该通路对空间任务同样敏感,颠覆了持续40年的神经科学经典理论。

模型在如图所示的合成图像数据集上进行了训练,图像中包含茶壶或计算器等物体,这些物体被叠加在不同的背景上。研究人员训练模型识别物体的一个或多个空间特征,包括旋转、位置和距离。Credit: Massachusetts Institute of Technology

研究团队使用3D图形引擎创建合成图像数据集(含茶壶、计算器等物体),分别训练卷积神经网络(CNN)完成物体分类和空间特征(旋转/位置/距离)预测。令人惊讶的是,仅训练空间任务的模型在神经对齐(neuro-alignment,衡量模型与生物大脑活动相似度的指标)测试中表现优异,与物体识别模型相当。通过中心核对齐(CKA)技术分析发现,两类模型在早期至中层的内部表征相似度高达87%,仅在后期网络层因任务需求产生分化。进一步实验表明,训练数据中的非目标特征变异促使模型学习更通用的视觉表征,而非特定任务专属模式。这一发现挑战了"腹侧流=物体识别"的传统分区理论,为理解视觉系统进化提供了新视角。

#AI驱动科学 #神经机制与脑功能解析 #计算模型与人工智能模拟

阅读更多:

Xie, Yudi, et al. Vision CNNs Trained to Estimate Spatial Latents Learned Similar Ventral-Stream-Aligned Representations. arXiv:2412.09115, arXiv, 17 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2412.09115

人类如何在没有数字的情况下做出决策

当面临"手术成功率50%"和"可能恢复行走能力"两种描述时,人脑如何权衡?耶鲁大学的Nachshon Korem和Ifat Levy团队开发出首个能处理定性决策的计算模型,该模型不仅适用于医疗选择,甚至能量化"更喜欢苹果还是香蕉"这类纯主观偏好。

风险与模糊性任务。设计:参与者被呈现四种情境下的不确定选项和确定结果的选择:风险性货币决策(A)、模糊性货币决策(B)、风险性医疗决策(C)和模糊性医疗决策(D)。在风险情境(A、C)中,结果概率以红色和蓝色矩形进行视觉表示,并且这些概率完全向参与者公开。Credit: PLOS Computational Biology (2025).

研究设计包含风险(已知概率)和模糊性(未知概率)两类不确定性,参与者需在确定结果与可能更好的结果间选择。医疗场景采用文字描述效果(如"中等改善"对应"需助行器短距离行走"),而非具体数字。通过分层贝叶斯模型=,研究者将"完全康复"等定性结果转化为可比数值。令人惊讶的是,这种非数值框架在传统货币决策测试中,预测准确率反而超过基于数字的效用函数模型。数据还显示,个体对模糊性的态度在医疗和财务决策中具有跨领域一致性(相关性r=0.42)。该模型未来可用于研究情绪(如恐惧)对医疗决策的影响。研究发表在 PLOS Computational Biology 上。

#认知科学 #计算模型与人工智能模拟 #跨学科整合 #决策机制 #行为经济学

阅读更多:

Korem, Nachshon, et al. “Modeling Decision-Making under Uncertainty with Qualitative Outcomes.” PLOS Computational Biology, vol. 21, no. 3, Mar. 2025, p. e1012440. PLoS Journals, https://doi.org/10.1371/journal.pcbi.1012440

训练LLMs自我净化语言

如何让AI语言模型自动过滤有害内容?麻省理工学院Ching-Yun Ko与Luca Daniel团队联合IBM研究院开发了SASA算法,使大型语言模型能在生成过程中自我检测并修正毒性内容,无需额外训练或外部工具。该技术有望解决AI聊天机器人的内容安全问题。

研究团队提出的自律自回归采样(SASA)技术,通过分析模型内部表示建立"毒性边界"。当模型生成每个新词时,SASA会评估当前句子在向量空间中的位置——若接近"有毒区域",则降低相关词汇的采样概率。测试显示,在Llama 3.1-8b模型上,SASA将毒性响应率从26.4%降至14.2%,同时保持语句流畅性。特别值得注意的是,该系统成功纠正了模型对女性相关提示的偏见响应,使其毒性水平与男性相关提示趋于一致。相比需要额外训练数据的方法,SASA仅增加约7%的计算开销,且兼容不同架构的LLMs。研究团队计划将该技术扩展至真实性、忠诚度等多维度价值观对齐。

#大模型技术 #预测模型构建 #AI伦理 #自然语言处理 #内容安全

阅读更多:

Ko, Ching-Yun, et al. Large Language Models Can Be Strong Self-Detoxifiers. arXiv:2410.03818, arXiv, 4 Oct. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2410.03818

社交网络易受AI操纵加剧极化现象

社交网络如何被AI轻易操纵?康考迪亚大学的Mohamed N. Zareer和Rastko R. Selmic团队开发了一种新型算法,仅需两个简单参数就能显著加剧网络极化,揭示了社交媒体平台在AI攻击面前的脆弱性。

研究团队分析了Twitter(现X平台)上约400万讨论疫苗话题的账户数据,开发出基于双重深度Q学习(Double Deep Q-Learning,一种能自主优化决策的AI技术)的对抗智能体。令人惊讶的是,这些AI操纵者仅需知道账户的当前观点和粉丝数量两个参数,就能精准识别最具影响力的攻击目标。通过在20个智能体组成的合成网络中测试,算法成功将网络分歧最大化。研究还发现,该方法适用于不同类型的社交网络结构,能有效模拟现实中的机器人攻击和协同虚假信息传播。这些发现为平台防御系统开发提供了重要参考,同时也敲响了AI伦理使用的警钟。研究发表在 IEEE Xplore 上。

#AI驱动科学 #预测模型构建 #社交媒体 #信息操纵 #网络安全

阅读更多:

Zareer, Mohamed N., and Rastko R. Selmic. “Maximizing Disagreement and Polarization in Social Media Networks Using Double Deep Q-Learning.” 2024 IEEE International Conference on Systems, Man, and Cybernetics (SMC), 2024, pp. 2311–17. IEEE Xplore, https://doi.org/10.1109/SMC54092.2024.10831299

AI做加法也"作弊"?科学家戳破大模型的数学泡沫

大语言模型是否真正理解数学原理?浙江大学与西湖大学的Yang Yan、Yu Lu、Renjun Xu和Zhenzhong Lan团队通过简单加法测试发现,这些"博士级"AI实际上依赖记忆而非真正学习运算规则,在符号转换测试中准确率暴跌至个位数。

研究团队设计了两整数加法(0-2^64范围)的"照妖镜"测试:首先让模型计算常规数字加法(如123+456),此时准确率达73.8-99.8%;但当数字被替换为抽象符号(如x+y)时,性能断崖式下跌至≤7.5%,暴露其无法实现组合泛化。更惊人的是,模型在1,700多个案例中违反加法交换律(A+B≠B+A),且数字位数增加时表现波动(非单调变化),完全不符合人类执行算法时的稳定模式。最具启示性的发现是:当研究者明确提供加法规则时,模型表现反而平均下降81.2%,而让模型自我解释(self-explanation)却能保持基准准确率,说明LLM的"数学思维"与人类认知存在根本性错位。

#大模型技术 #计算模型与人工智能模拟 #跨学科整合 #数学认知

阅读更多:

Yan, Yang, et al. Do PhD-Level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models. arXiv:2504.05262, arXiv, 7 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.05262

MineWorld:基于Minecraft的实时交互式世界模型

如何让AI像人类一样实时理解并改变虚拟世界?微软研究院的Junliang Guo、Yang Ye等团队开发了MineWorld,这是首个在Minecraft游戏中实现每秒4-7帧实时交互的世界模型,为游戏开发和机器人训练提供了新工具。

研究团队将游戏画面和玩家动作统一编码为离散token,通过视觉-动作自回归Transformer学习两者关联。为解决传统自回归推理速度慢的问题,他们开发了并行解码算法——通过分析空间相邻token的依赖关系,让模型能同步预测多个token,速度提升3倍以上。评估阶段,团队提出"逆动力学指标":用AI反向解析生成视频中的动作,与真实输入动作对比验证可控性。结果显示,MineWorld在画面质量和动作跟随性上均超越现有开源扩散模型,且能实时响应玩家操作。该技术未来可应用于游戏NPC开发、机器人虚拟训练等场景。

#大模型技术 #计算模型与人工智能模拟 #大模型技术 #跨学科整合

阅读更多:

Guo, Junliang, et al. MineWorld: A Real-Time and Open-Source Interactive World Model on Minecraft. arXiv:2504.08388, arXiv, 11 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.08388

整理|ChatGPT

编辑|丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。