AI视频生成模型能力迎来质变:字节跳动旗下AI视频生成模型Seedance 2.0已经推动推动视频生成从“生成一段画面”向“完成一个作品”的跨越。

Seedance 2.0于2月9日一经推出便引发市场广泛关注,随即“引爆”资本市场相关板块:2月10日A股传媒、AI应用及多模态语料相关板块集体走强:

打开网易新闻 查看精彩图片

中银证券认为,本次Seedance2.0提升的能力主要包括四个方面,可给普通用户提供达到接近“导演级”精度的服务能力,包括自分镜和自运镜、全方位多模态参考、音画同步生成、多镜头叙事能力。Seedance2.0提升生成视频可用率,有望大幅降低制作成本。

该模型可基于单一文本提示或静态图像,在60秒内生成包含原生音频的多镜头序列视频。其创新性在于:多模态参考输入:支持文本、图像、甚至草图作为生成起点,提升内容可控性;多镜头一致性保持:AI自动维持角色外观、视觉风格与场景氛围在镜头切换中的连贯性,无需人工干预;原生音视频同步:视频生成与音频生成并行,确保对白、环境音与画面节奏精准匹配;自动分镜运镜:根据叙事逻辑自动生成镜头组接与运动轨迹,实现专业级叙事结构。

这些能力系统性解决了当前AI视频生成在可控性、连贯性、表现力与制作门槛上的核心痛点,显著降低AI漫剧、短视频、广告创意等内容的生产成本与技术门槛,适用于影视预演、社交媒体内容创作、教育动画、电商产品演示等场景。

目前公开资料未披露其具体网络结构参数、训练数据规模或推理延迟指标,亦无官方发布的量化性能对比数据(如FID、LPIPS等指标)。模型技术细节仍以功能描述为主,未开放源码或API接口。

中银证券进一步指出,Seedance2.0等AI技术或推动漫剧行业进入规模化发展阶段。传统动漫往往需数年打磨,资金投入动辄千万元,漫剧“短视频化”的轻量化产品制作周期较短,且创作门槛大幅降低,行业有望迎来加速发展。

当前,多模态语料数据支撑企业在实际应用中面临数据质量与供给、技术处理、安全合规、商业落地四大核心挑战。

在数据质量与供给挑战方面,主要存在高质量多模态数据稀缺且分布不均等问题,与此同时数据分布广泛且标准不一,跨部门、跨地区共享机制不健全,数据碎片化与孤岛问题显著。

在技术处理方面,多模态数据处理效率与成本矛盾突出:数据标注依赖人工密集型外包,效率低、标准不一;多模态数据融合需解决异构数据对齐、特征提取等问题。

而在更高维度上,数据数据隐私与权属规则待明确,安全合规问题有待解决。

本文来自和讯财经,更多精彩资讯请下载“和讯财经”APP