现在,AI公司希望获得授权的视频训练数据,因为他们的模型正在超越文本和图像向视频领域进军。媒体公司拥有数百万小时的视频数据。然而,一直以来缺乏将原始素材转化为可大规模使用的数据集的基础设施。
Versos AI表示它已经构建了这一缺失的环节。该公司宣布了一个名为"视频库智能平台"(Video Library Intelligence Platform)的新平台,旨在将海量视频数据转化为专门为AI训练构建的结构化和可授权数据集。这表明视频内容在多模态AI时代可能开始作为训练材料承载新的价值。
为什么对高质量训练数据的需求正在加剧?
首先,不同于静态的图像,视频随时间变化,提供更深层的信息。它本质上也是多模态的,需要捕捉视觉数据、语音、环境线索、人类行为和其他参数。研究人员所说的"世界模型"(world models)也在发生重大转变。这些是试图理解物理世界如何运作的AI系统。视频为模型提供了其他媒体类型无法提供的更丰富的因果关系和人类互动模式。
Versos AI希望通过视频库智能平台挖掘这一潜力。
"AI训练已经超越了抓取数据。"Versos AI首席执行官兼联合创始人Chris Keevill说,"视频在结构和规模交付方面带来了显著的复杂性。Versos AI的构建旨在端到端地管理这种复杂性——这样内容所有者可以解锁新的收入流,而超大规模企业可以对授权数据集进行模型训练有信心。"
"直到现在,还没有专门的解决方案将非结构化视频库转化为适合超大规模AI训练的结构化数据集。Versos AI通过使视频数据可搜索、可授权并为模型开发做好准备,填补了这一空白。"
挑战不仅仅是数据的量,还有结构
原始素材并不自动对机器学习有效。在被输送到AI系统之前,原始素材可能需要分段,权利必须得到验证,交付格式必须匹配,元数据可能需要附加。如果没有这种准备,即使是数百万小时的视频仍然很大程度上无法用于训练目的。
Versos AI的工作方式
Versos AI的工作原理是首先从内容所有者那里获取大型视频库。在结构化提取后,重点转向场景检测和时间分割。这种分割将一个长文件转换为数千个索引的微单元。随后进行元数据丰富化和多模态标记,为分析准备文件。然后权利元数据被附加到每个索引段,以确保许可清晰度和合规性。最终,结构化的片段被组装成训练就绪的数据集,并安全地交付给AI开发人员以供大规模使用。
通过将原始素材转化为已索引和权利清晰的数据集,Versos AI将自己定位在媒体档案和AI需求的交汇点。
"我们看到来自主要超大规模企业、AI创新者和技术领袖的非凡需求,他们认识到高质量、结构化的视频和元数据是训练更强大、更丰富上下文模型所必需的。"CuriosityStream总裁兼首席执行官Clint Stinchcomb说。
"我们超过250万小时的视频和音频的庞大库,结合Versos AI一流的交付和索引能力,有助于将CuriosityStream定位为下一代AI模型的领先提供商。我们很激动拥有像Versos AI这样的合作伙伴,使我们在AI视频数据训练达到AI市场繁荣的下一个拐点时能够加速增长。"
CuriosityStream所描述的紧迫性反映了Versos AI从一开始就着手解决的问题。Versos AI成立于2023年,专注于使大量视频对AI公司可用。视频库智能平台是该使命的重大飞跃。
然而,Versos AI在一个快速兴起的领域运营,像Scale AI和SuperAnnotate这样的竞争对手也在从事视频注释和训练数据工作流程的工作。Versos有自己的定位,它声称是AI供应链中视频训练数据的端到端解决方案。他们的赌注是,随着对结构化视频数据需求的加速,控制从摄取到合规交付的完整管道将比任何单一注释功能更重要。
热门跟贴