你能想象AI像老医生一样"看懂"手术视频吗?

3月24日,中科院发布了"术影"手术视频大模型,它用3658小时真实手术视频训练,学会了理解13种器官、6类手术任务,17项国际测试全部第一。

打开网易新闻 查看精彩图片

这和以前有什么不同?

以前AI只能"认图"——告诉你画面里有什么。现在AI能"理解"——知道医生在做什么、器械怎么配合、操作规不规范。术影”基于V-JEPA架构,引入三项关键技术革新,让AI首次学会“阅读”手术视频的动态叙事:

  • 运动引导的隐空间预测:模型自动聚焦于关键运动信息和中高层语义,如器械与组织的精细交互、手术步骤的流畅衔接。
  • 特征多样性保持:训练中强制保留特征多样性,确保捕捉手术场景中的细微变化与异常。
  • 模型稳定性保持:通过动态调整学习策略,保障长序列视频理解中的稳定性。

这三重革新共同构成能够理解手术行为背后意图与逻辑的通用视觉感知底座,为手术AI的“GPT时刻”奠定技术基础。

打开网易新闻 查看精彩图片

它能帮医生做什么?

简单说,就是成为医生的"智能助手"。新手医生可以跟着它学,老医生可以用它复盘,医院可以用它评估技术水平。

最重要的是,它已经开源了,全球医疗团队都能免费用。

研发团队说得很清楚:AI是来帮忙的,不是来取代医生的。决策权永远在医生手里。

科技进步的意义,从来不是替代人类,而是让人类做得更好。