当像素级精细可控重新成为视觉生成的「圣杯」,当端侧设备开始实时「脑补」三维世界,当机器人不再满足于「看懂」画面而是要求「预判」物理因果——CVPR 2026 在美国丹佛揭示的,是一场从「算法精度竞赛」到「系统范式重构」的深层跃迁。
作为 CVPR 的长期关注者与深度追踪者,机器之心观察到今年 CVPR 两条清晰的主线:
- 视觉智能正沿着「像素合成 → 内容创造 → 时空交互」的链路全面升维,从潜空间扩散回归端侧实时生成,从静态二维创作迈向动态四维时空编辑;
- 具身智能则打通了从空间表征、世界模拟到闭环决策的完整链条,空间基础模型、世界模型与 VLA 的协同成为「决策有用」的关键支点。
两条主线交汇之处,正是下一代 AI 从数字世界走向物理世界的临界点。为此,我们特别在 CVPR 2026 现场策划两场专家技术圆桌直播,邀请学界与产业界一线研究者深度拆解这些正在发生的技术变革。
在 6 月 6 日(北京时间)的圆桌直播中,4 位嘉宾将会围绕「视觉生成基础模型与系统架构」「端侧生成式计算摄影」「生成式图像视频编辑与内容生产」「3D/4D 重建及生成」等议题展开深度探讨。
在 6 月 7 日(北京时间)的圆桌直播中,4 位嘉宾将会围绕「空间基础模型」「世界模型」「具身智能体与 VLA」「物理 AI 基础设施」等议题展开深度探讨。
- 圆桌一:北京时间 6 月 6 日 09:00-11:00
- 圆桌二:北京时间 6 月 7 日 09:00-11:00
两场直播均设有 QA 互动环节,欢迎预约观看并在评论区与嘉宾交流讨论。
热门跟贴