Charli D'Amelio的跳舞视频被AI总结成"各种蓝莓配不同配料",Shakira的表演变成"蓝色几何图形重复移动"——这不是什么抽象艺术评论,是TikTok刚上线的AI视频摘要功能的真实产出。

据Business Insider报道,TikTok近期推出的AI文本摘要功能正在大幅回滚。这款本应描述视频内容的工具,因频繁出现离谱错误,现已从"内容总结"降级为仅识别视频中出现的商品。

打开网易新闻 查看精彩图片

错误案例堪称荒诞。除了把顶流网红的舞蹈视频识别成蓝莓拼盘,还有用户发现:一段普通的训狗视频被描述为"用单张纸精心折叠的复杂折纸艺术",Shakira的演出画面则成了"数个蓝色形状在屏幕上反复出现和移动"。这些摘要与视频内容毫无关联,却一本正经地呈现在用户界面中。

更蹊跷的是产品决策本身。Business Insider指出,目前尚不清楚这项存在严重缺陷的功能是如何通过测试、最终进入正式版本的。通常而言,面向数亿用户的功能更新需要经过多轮质量把关,但TikTok的AI摘要显然跳过了某些环节——或者测试阶段的评估标准与真实场景存在巨大落差。

从"描述视频内容"退守到"识别商品",这个调整暴露了当前AI视频理解的现实瓶颈。视觉-语言模型的"幻觉"问题在静态图片领域尚未完全解决,动态视频的时间维度让错误率进一步放大。当AI试图同时处理画面内容、音频信息、场景切换时,输出结果可能离题万里,却保持着自信的语气。

TikTok的应对策略也颇具代表性:不直接下线功能,而是收缩能力边界,把"开放域描述"改成"限定域识别"。商品识别有明确的视觉特征库和标签体系,出错空间相对可控。这种"降级保活"的思路,在其他平台的AI功能迭代中同样常见。

Mashable已向TikTok寻求置评,目前尚未收到回应。这款曾把明星变成蓝莓的AI功能,现在至少不会再一本正经地胡说八道了——它学会了闭嘴,只报商品名。