智东西作者 王涵编辑 云鹏
打开网易新闻 查看精彩图片
智东西作者 王涵编辑 云鹏

智东西6月12日报道,今天,在智源大会2026上,智源研究院分享并发布了近一年以来的多项研究成果,包括基座大模型、智能体和基础软硬件生态三部分。

基座大模型方面,智源分享了原生多模态大模型悟界Emu3.5、AI药物发现模型悟界·OpenComplex 2.5等的研究进展,并在会上发布了神经科学模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神经科学领域数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken

打开网易新闻 查看精彩图片

智能体方面,智源进一步介绍了其具身大脑悟界·RoboBrain Orca v0,发布了四款智能体产品,包括面向心脏疾病的辅助诊断智能体、面向科学发现的自主研究智能体、智源大会专属听会智能体有害蛋白识别智能体。在基础软硬件生态方面,智源发布众智FlagOS 2.1,该系统能够适配18家芯片厂商的32款芯片。

在大会开幕演讲中,美国工程院院士、2015年图灵奖得主Whitfield Diffie围绕AI安全提出:当前依赖反馈控制的方法效果不佳,他主张形式化方法才是未来,即先明确形式化规范、再编写程序、最后数学证明程序符合规范,他乐观认为未来AI将成为完成这些证明的工具,大幅提升可靠性。演讲尾声,Diffie给出惊人预测:到2050年,机器智能将超越人类,成为世界运行的主宰

打开网易新闻 查看精彩图片

图灵奖得主、马萨诸塞大学阿默斯特分校荣誉退休教授Andrew Barto,将强化学习归结为“控制、搜索与联想记忆”的三位一体,指出“机器学习最初就是强化学习”。他强调强化学习与神经网络研究从一开始便紧密交织,深度强化学习结合大脑奖励系统的最新成果将指引下一轮方向。最后他警示:奖励信号设计可能带来“反常实例化”风险。

打开网易新闻 查看精彩图片

在播客环节,中国工程院院士、阿里云创始人王坚智源研究院理事长黄铁军展开对话,围绕中国大模型的发展路径展开,重点讨论了从追赶验证到路线选择、体系构建与范式创新的转型,如何突破互联网文本数据的天花板和算力短缺的极限,以及如何从“跟随国际主流范式”转向“形成自身问题意识”、实现原创范式跃迁。

打开网易新闻 查看精彩图片

在智源研究院院长王仲远主持的圆桌对话中,小米罗福莉、清华朱军、清华刘知远、南洋理工安波四位专家进行了近50分钟的深度交流。

罗福莉认为引发热议的Claude Fable 5本质仍是预训练、数据与强化学习持续推进的自然结果;朱军指出新版模型Token消耗下降是正确方向;刘知远分析Anthropic的成功源于找准代码这一专业领域,并强调智能革命在于用AI替代机械重复的脑力劳动;安波则提出AI自进化不能依赖封闭环境。

打开网易新闻 查看精彩图片

一、“悟界”登《Nature》,发布全球最大最全的神经科学数据集

智源研究院院长王仲远分享了近一年来智源研究院的相关研究进展。

基座大模型方面,智源研发的原生多模态大模型悟界Emu3.5,在去年10月30日就已经正式发布并且开源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是国内多模态大模型方向的第一篇

悟界·Emu3.5通过Next-Token Prediction这一实现方式,实现了文本、图像、视频的统一学习,实现了多模态理解任务和多模态生成任务的统一学习。

智源将Next-Token Prediction扩展到了神经科学领域,研发出了悟界·Brainμ1.0,该模型能够将脑信号与其它模态互相转化,可以将脑信号转成文字、图像、声音,同时可以反过来转换。

打开网易新闻 查看精彩图片

同时,智源发布了全球最大最全的AI-Ready神经科学领域数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken。

打开网易新闻 查看精彩图片

此外,智源还发布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驱动药物发现模型。通过单一的流程,该模型覆盖了制药的四大关键步骤,包括口袋识别、反向筛选、结构预测、形成力预测。OpenComplex 2.5在多个benchmark上的核心指标,超过了传统的物理方法和其他的AI模型。

打开网易新闻 查看精彩图片

二、提出世界模型四类技术路线,自研世界模型即将开源

世界模型方面,智源将当下世界模型的技术路线分为四类

1、第一类是语言为中心的世界模型,包括VIMA等。

2、第二类是以像素为中心的视觉模型,如Sora。

3、第三类是以三维结构为中心的视觉模型,代表是李飞飞团队成果。

4、第四类是以视觉表征为中心的世界模型,像是杨立昆团队成果。

打开网易新闻 查看精彩图片

王仲远分享称,智源认为,以上四类技术路线距离真正的世界模型还存在一定差距。智源正在研发当中的世界基座模型——悟界·Physis v0.1。该模型具有AI底层典型四大核心能力:物理一致性、动作灵活性、长程可推演、通用泛化性。其通过为理前的空间建模,能够真正实现全模态的输入,以及下一步物理状态的预测。

该模型目前还在训练中,将在未来几个月开源。

打开网易新闻 查看精彩图片

三、发布具身大脑,推出四款智能体

具身智能方面,王仲远透露,智源最新研发的具身大脑悟界·RoboBrain Orca v0,是以下一个物理状态预测为核心的具身大脑。它通过融合大量的多模态交互数据,强化了世界模型在具身上的表征,提升下游少量样本泛化能力,目前已与50余家企业进行了合作。

打开网易新闻 查看精彩图片

智能体方面,王仲远在现场发布了四款智能体产品,包括:

1、面向心脏疾病的辅助诊断智能体:BAAI Cardiac Agent

该智能体是智源智源与安贞医院共同研发的,能够有效识别和处理心脏磁共振的多模态数据,提升医生的诊断效率。其心脏疾病诊断的精确度,能够达到安贞医院顶尖心血管医生的诊断水平

打开网易新闻 查看精彩图片

2、面向科学发现的自主研究智能体:AREX

该智能体能够覆盖科学研究的几个关键环节,包括信息调研、方案设计、实验探究、报告撰写。其背后所依赖的基座模型由智源自主研发。在权威的基准测试上,不仅能够显著超越同等参数的开源模型,更能够比肩万亿参数级别的旗舰模型。

打开网易新闻 查看精彩图片

3、本届智源大会专属的听会智能体:SoulAgent

该智能体可以帮助参会者实现智源大会一站式参会体验,同时也能够与先期入驻的智源大会的专家进行AI问答。

打开网易新闻 查看精彩图片

4、面向有害蛋白获取的风险发现智能体

智源首次通过红队实验的方法验证:智能体能够辅助筛查并获取有害的蛋白,进而合成蛋白,将在近期公布相关的测试报告。

打开网易新闻 查看精彩图片

四、FlagOS更新至2.1版本,适配32款芯片

在基础软硬件生态方面,王仲远介绍,智源研究院联合开源社区打造的众智FlagOS 现已更新至 2.1 版本。该系统适配18家芯片厂商的32款芯片,是目前全球适配芯片品类最多的计算系统

FlagOS内置算子超600个且数量仍在持续扩充,不仅为18家芯片厂商提供统一AI编译器、为12家厂商提供通用技术支持,还同时完成国际标准与国家标准立项。

目前该系统可支撑90%以上主流开源模型部署,近期已完成DeepSeek、千问、MiniMax、MiniCPM、混元等多款热门模型的无缝适配。

打开网易新闻 查看精彩图片

结语:AI技术发展,已经迎来拐点

本届智源大会释放出多项行业动向。

首先,AI研究方向日趋多元,行业不再单纯追逐模型参数规模,逐步向脑科学、药物研发、心脏疾病诊断等实体应用领域深耕。其次,基础软硬件生态落地提速,众智FlagOS已实现对32款芯片的适配,底层技术布局初见成效。

此外,两位图灵奖得主与国内专家在分享中形成共识:随着AI技术持续演进,仅依靠算力与数据堆砌已难实现长远发展,技术路线规划、安全体系搭建以及人机协同关系等核心议题,亟待全行业深入探索与正视。