打开网易新闻 查看精彩图片
AI视频现在能画出以假乱真的画面,却搞不定一只正常走动的钟。研究人员发现,主流视频生成模型——包括Runway、Pika、可灵在内——生成的时钟不是指针乱飞,就是数字排列成外星文,甚至出现"88:77"这种人类看了窒息的时间。
这个问题被业内称为"隐形坏钟"。它不像画面崩坏那么显眼,观众潜意识觉得"哪里不对",却说不清原因。类比一下:就像餐厅装修奢华,但服务员递来的菜单上日期印错了——信任感瞬间漏了个洞。
问题根源在于训练数据的偷懒。模型学的是"钟大概长这样",而非"钟必须遵守物理规则"。OpenAI前研究员Andrej Karpathy曾吐槽:「视频模型对时间的理解,堪比醉汉对直线的认知。」
更扎心的是修复难度。给模型加"时钟约束"不难,难的是用户不会只为看对时间而多等30秒渲染。目前Runway已在内部测试物理一致性模块,但上线时间未定——毕竟,比起时钟准不准,大家更想先让AI画出6根手指的人。
热门跟贴