7月30日,备受瞩目的“国产Sora”,作为Sora全球首个挑战者的视频大模型Vidu(www.vidu.studio)正式上线。目前Vidu无需申请,用户直接用邮箱注册即可上手体验。

打开网易新闻 查看精彩图片

生数科技是全球领先的多模态大模型公司,深耕视频生成、3D生成和图像生成领域。Vidu作为国内首个发布的全自研视频大模型,性能全面对标OpenAI的Sora。面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域,生数科技致力于用AI激发全人类的生产力和创造力。

自4月底首次亮相以来,Vidu凭借媲美Sora的文生长视频能力,迅速在国内外引起广泛关注。此次Vidu全面开放了文生视频、图生视频两大功能,提供4s和8s两种时长选择,分辨率最高达1080P。在效果上,不仅延续了四月份展示的高动态性、高逼真度、高一致性等优势,还在上线版本中新增了角色一致性(CharacterToVideo)、动漫风格、文字与特效画面生成等特色能力。

AI视频工具有个重要指标——推理速度,这一关键指标不仅直接影响用户体验,更是产品实用性的决定性因素。目前,市面上的主流AI视频工具在生成4秒左右的视频片段时,用户通常需要等待1到5分钟,甚至更长。例如,Runway最新推出的Gen-3工具需要1分钟来完成5s视频生成。然而,Vidu将这一等待时间缩短至仅需30秒(可真实实测),速度比业内最快水平的Gen-3还要再快一倍。Vidu的高效推理不仅为用户带来了接近于无缝的创作体验,更短的处理时间还意味着它能够轻松应对大量用户的需求,提供个性化的服务。这种高效性能不仅提升了用户体验,也大大增强了Vidu的竞争力。

这样密集而快节奏的模型训练任务,不仅需要大规模的算力,还需要从数据准备到模型训练、再到模型推理的全链路保障。百度智能云提供了系统性、端到端的大模型训练服务。在基础设施层面,Vidu采用了百度百舸AI异构计算平台,实现大模型开发的“快、稳、省”,带宽有效性95%,千卡混合训练效能达95%,有效训练时长98.8%,助力生数科技短时间低成本开发出「逐鹿世界」的多模态大模型。

随着Vidu的正式上线,一场由国产视频大模型引领的创意革命正蓄势待发。百度智能云携手生数科技,以技术创新为驱动,正逐步揭开AI赋能创意未来的新篇章。在这个充满无限可能的新时代,让我们共同期待,有更多场景应用的多模态模型引领我们步入一个更加高效、便捷、富有创意的数字世界。