打开网易新闻 查看精彩图片

嗨大家好!我是阿真!

上周从北京回来有点感冒,躺了几天休息好了,今天来看看 Vidu Q3 上新的参考生视频。可算是来了啊哈哈。

简单说一下这次更新的内容:

1.万物可参考。不只人脸,角色、场景、服装、道具都能参考,完全可以同时丢好几张参考图进去多元参考。

2.可生成多种特效。粒子、流体、光影等等这些以前要靠后期合成的东西,现在生成的时候就有了。

3.多种音效都能同步生成,且音画同步。环境音、动态音、氛围音等都能同步生成,告别无声视频。

4.针对具体应用场景有进一步优化。漫剧、短剧、影视剧、广告,这些应用场景效果都有所提升。

上链接:Vidu.cn
用我的码AZHEN,新用户注册可领取 500 积分。

打开网易新闻 查看精彩图片

Q3 发布后就登顶了 Artificial Analysis 国际榜单。在全球首个参考生视频榜单 SuperCLUE-R2V 上,Vidu Q3 也拿下了多图参考总榜第一,单图人物还原度也以 72.43 分登顶,双榜断层领先。主体一致性满分,模型回复率也是唯一的 100%,成绩确实很硬。

话不多说,接下来一起看看效果。下面的视频都是由 Vidu Q3 参考生视频完成。图片和视频均为 AI 生成。

万物可参考

光说概念可能有点抽象,直接看案例。

首先是角色 + 人声参考。这里两个人像参考,人物一致性维持住了,女角色对镜头说话,口型、表情、语气都很自然。参考生视频加上人声能力,口播类内容直接可用了。这对拍短视频和广告等场景来说是很实际的效率提升。

参考图与输出视频

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

Shot 1 (0s - 4s):画面描述:中景。@图3的温暖播客录音室里,两支麦克风和调音台摆在木桌中央,窗外透进柔和暖光。@图1中的女主持人与@图2中的男主持人分别坐在桌子两侧,面向彼此又微微朝向镜头,像节目刚刚开始,整体氛围专业、轻松、亲切。运镜设计:镜头从录音室环境缓慢推进到双人中景,先带到麦克风和调音台,再自然落在两位主持人身上。特效设计:暖色阳光在桌面、麦克风金属网罩和人物发丝边缘形成柔和高光,背景保持轻微虚化。专属音效:安静的室内环境底噪、设备轻微电流声、舒缓轻快的节目开场音乐淡入。Shot 2 (4s - 10s):画面描述:中近景。女主持人自然看向镜头,露出亲切笑容,微微前倾靠近麦克风,用清晰明快、稍带节目感的语气完整说道:`嗨大家好,今天我们的话题是Vidu Q3参考生视频来了。`这句话要完整说完,语速自然,不要太赶。男主持人在一旁轻轻点头,带着配合感和期待感看向她。运镜设计:镜头轻微推近女主持人,同时保留男主持人的半身在画面中,形成自然的双人播客构图。特效设计:人物面部光线干净柔和,麦克风边缘有细腻金属高光,整体保持真实温暖的录音室质感。专属音效:女主持人清晰自然的开场台词声、男主持人轻微呼吸和椅子细小动作声、背景音乐适当降低为台词让位。
额外要求:整体统一为温暖真实的播客节目风格,重点表现`双人对谈 + 开场介绍`的自然状态;台词必须完整清晰说出`嗨大家好,今天我们的话题是Vidu Q3参考生视频来了`;不要字幕,不要屏幕文字,不要贴片文案,不要水印,不要 logo,不要 UI 界面,不要画面中出现任何可读文字。@图1@图2@图3

使用也很简单,首先在网页选择【参考生视频】,然后上传图片。

如果图片中的人物需要长期使用,建议将其上传为【主体】,方便下次直接选择调用。然后填入提示词。在需要 @参考图的时候,直接用 @ 就可以召唤相关的图片作为参考。

接下来就可以继续选择模型,设定时长、编码格式、生成模式和宽高比、每次生成的视频数量等

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

继续案例。

接下来是服装参考。左边是一套粉色汉服马面裙,右边是参考了这套服装后生成的视频。女生穿着这套汉服走在樱花林里,裙摆随步伐轻轻摆动,腰间宫绦叮当作响,花瓣从发间飘落。人物、服装的粉色色调、裙摆褶皱、腰间配饰还原度都很高。再加上古筝和箫的背景音乐(Q3 的音效能力),氛围感一下就有了

打开网易新闻 查看精彩图片

  • 1

@图1穿着@图2的汉服走在樱花林小径上,春风吹来,满树樱花花瓣纷纷飘落。她伸出手接住几片花瓣,低头微笑。马面裙裙摆随步伐轻轻摆动,宫绦和禁步随步伐叮当轻响。她转身面对镜头,花瓣从她发间和肩头飘过。背景音乐是古筝配箫的舒缓曲调。镜头从远景跟随到中景,环绕半圈停在正面。

接下来是我觉得有趣且能体现“万物可参考”的一个例子。有一天我突然有一个脑洞,类似于王母娘娘把一个发簪扔到地上,就变出一个建筑这样的玩法,所以就有了下面的视频。这里并不是首尾帧,只是让它自己基于这两张参考图去自由发挥。

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

  • 14

  • 15

  • 16

  • 17

  • 18

  • 19

  • 20

  • 21

  • 22

  • 23

  • 24

  • 25

  • 26

Shot 1 (0s - 3s):画面描述:中景。半空中悬浮着[@图1]那根凤凰造型的金色发簪,簪身缓缓旋转,红色宝石核心稳定发光,周围空无一物,像被某种神秘力量托起。随着光芒增强,发簪尾羽和凤凰纹样开始向下投射出金红色光线,在地面勾勒出建筑的基础轮廓。运镜设计:镜头从近距离发簪主体缓慢后拉并轻微下摇,带出下方即将形成的建筑地基区域。特效设计:红宝石发出脉冲式光芒,金色羽纹化作光丝向下流动,地面浮现发光的建筑平面线稿和基础阵纹。专属音效:空灵金属鸣响、低频能量嗡鸣、细碎光粒流动声。Shot 2 (3s - 6s):画面描述:中远景。建筑开始按照真实施工逻辑从地基阶段生成,地面先隆起宽阔的白色石基与台座,中央主阶梯和两侧基础平台逐步成形,石材块体一层层向上拼接,整体结构稳稳立住。发簪依旧悬浮在上方,像在主导整个建造过程。运镜设计:镜头继续缓慢后撤,略微抬高视角,完整看到地基、台座和阶梯从无到有的生长过程。特效设计:地面阵纹亮起,白色石块由金红色粒子凝聚成实体,拼接处带有短暂流光。专属音效:厚重石材升起声、低沉震动声、细碎能量凝结声。Shot 3 (6s - 9s):画面描述:中景转大全景。地基稳固后,建筑主体开始向上构建,红金色立柱先从台座上升起,接着梁架、斗拱、殿门和主体墙面依次拼接完成,整体结构按照从下到上、从骨架到外墙的顺序逐步搭建,主殿轮廓清晰出现,已经能看出[@图2]那座凤凰神殿的整体比例。运镜设计:镜头缓慢环绕半圈并继续后拉,让观众看到立柱、梁架和主体体量一步步建立起来。特效设计:金色光线像榫卯结构的引导线一样在空中先行勾勒,随后木石金属构件沿着光线精准落位,梁柱接合处闪过短暂火花般灵光。专属音效:梁柱升起的木石共鸣声、结构咬合的清脆卡合声、持续增强的神圣能量低鸣。Shot 4 (9s - 12s):画面描述:大全景。主体结构完成后,屋顶开始生成,重檐飞檐、金红瓦面、脊饰和屋顶层层铺开,随后凤凰展翼造型的巨大正立面装饰从主殿前方展开,中央红色宝石嵌入建筑正中,整体建筑已经接近完工,形态与[@图2]高度统一。运镜设计:镜头微微上扬并向前压近一点,突出屋顶、飞檐和正立面巨型凤凰装饰展开时的壮观感。特效设计:金色羽翼由光粒展开成实体,红宝石核心落位时爆发一圈温暖金红色光环,屋顶边缘有流光沿轮廓快速扫过。专属音效:羽翼展开般的宏大风鸣声、宝石嵌入时的清亮鸣响、建筑成型时的层层能量回响。Shot 5 (12s - 15s):画面描述:大全景转中远景。最后进入装饰完成阶段,龙纹柱雕、门框金饰、红色宝石点缀、阶梯细节和整体鎏金纹样依次被点亮补全,整座建筑彻底完成,发簪的光芒缓缓收束并融入主殿中央的凤凰宝石之中,仿佛整根簪子最终化为了这座神殿的灵魂核心。建筑在阳光下庄严辉煌,和[@图2]完全一致。运镜设计:镜头缓慢稳定推进到正面英雄构图,最终停在完整神殿的正中视角,形成震撼收尾。特效设计:所有装饰细节被金色流光依次点亮,最后一道能量从空中的簪子落入建筑中央红宝石,整座神殿短暂泛起神圣辉光后稳定下来。专属音效:细密装饰生成时的清脆灵响、最终能量归位的厚重共鸣声、尾音悠长的神圣风铃声。额外要求:建筑生成过程必须符合真实建造逻辑,先地基和台座,再主体立柱梁架,再屋顶,再正立面与大型装饰,最后补足细节装饰;不要字幕,不要屏幕文字,不要贴片文案,不要水印,不要 logo,不要 UI 界面,不要画面中出现任何可读文字。

整体效果很有意思。从这几个案例,角色+人声参考、服装参考、道具参考,可以看到 Q3 参考维度的广度,现在是创作素材的多个维度都打通了。

应用场景 漫剧

试下来,漫剧是我觉得 Q3 参考生视频目前最成熟的方向。二维三维虚实结合都可以玩。

先来一个抽象的,我这里给到的参考图包括了真实人物、森林场景、虚幻背景,还有真实的乐器。给了三张不同风格的设定图作为参考。生成的视频中,角色的服装、绿色长发、尖耳朵、白色长裙以及五官细节都基本保持了一致性,身子的发光效果和雾气也还原得很好,同时,乐器的细节也保持到了比较精确的程度

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

  • 14

  • 15

  • 16

  • 17

  • 18

  • 19

  • 20

  • 21

  • 22

  • 23

  • 24

  • 25

  • 26

  • 27

Shot 1 (0s - 3s):画面描述:大全景。[@图2]的精灵森林在薄雾与晨光中缓缓显现,巨树、发光苔藓、幽蓝蘑菇和散落的绿色晶石共同构成神秘空灵的舞台空间,空气里漂浮细小萤火般光点,整片森林安静得像在等待一场演出开始。运镜设计:镜头从高处缓慢下压并向前推进,穿过树干与薄雾,最后落向林间空地中央。玄幻特效:林间有柔和体积光,绿色灵气粒子和微弱荧光沿地面缓慢流动,晶石表面偶尔闪烁。专属音效:森林风声、远处鸟鸣、细小灵光嗡鸣声、空灵铺底音乐缓缓进入。Shot 2 (3s - 6s):画面描述:中景。[@图1]中的精灵少女出现在林间空地,长长的薄荷绿色头发垂落到腰间,银白色礼服在微光中泛着柔和冷辉。她伸手接过[@图3]那把珍珠白电吉他,指尖轻轻拂过琴身和琴弦,神情平静而专注,像即将唤醒森林中的某种力量。运镜设计:镜头继续向前靠近,并自然绕到她的侧前方,既看见人物精致造型,也看见她拿起吉他的动作。玄幻特效:吉他被触碰时,琴身边缘泛起浅金色与薄荷绿混合的微光,周围飘起细小发光粉尘。专属音效:衣料轻拂声、手指划过琴弦的轻响、环境底噪略微收静。Shot 3 (6s - 9s):画面描述:中近景。精灵少女抱起吉他,轻轻拨下第一串音符,四周森林立即被唤醒,地面的晶石、蘑菇和树根间的灵光随旋律一层层亮起,她的发丝、耳饰和裙摆在能量波动中轻轻扬起,整个人像与森林共鸣。运镜设计:镜头缓慢推近到上半身和吉他演奏动作,轻微环绕半步,突出人物、乐器和环境联动。玄幻特效:每一次拨弦都会扩散出半透明音波光纹,绿色和银白色光粒沿地面、树根和空气向四周蔓延。专属音效:清澈梦幻的电吉他旋律、森林回响、灵气被唤醒时的细密叮鸣声。Shot 4 (9s - 12s):画面描述:近景。精灵少女进入更投入的演奏状态,手指流畅扫弦,眼神明亮而沉浸,吉他音色变得更有力量。她一边弹奏一边轻轻开口吟唱:“我把月光唱给你听。”她的声音空灵温柔,像和整片森林的微光一起流动。她周围开始聚集大量发光粒子和萤火般灵蝶,林间薄雾被旋律轻轻卷动,画面兼具梦幻感和舞台感。运镜设计:镜头贴近她的脸、手部和吉他,做一段流畅的小幅跟随移动,增强演奏张力。玄幻特效:琴弦振动时溢出光丝,灵光在她身后形成半弧形光轨,森林背景被映出层层深浅不一的绿蓝色光。专属音效:空灵电吉他旋律、她清晰温柔的吟唱声、粒子流动与灵蝶振翅声。Shot 5 (12s - 15s):画面描述:中近景转特写。精灵少女拨出最后一个悠长音符,抬眼看向前方,神情温柔又带一点神圣感,手中的白色电吉他在微光中闪耀,整个森林被她的音乐照亮,最终停在她面部、耳尖、发丝高光和吉他上半身同框的唯美收尾画面。运镜设计:镜头从中近景稳定推近到人物与吉他的特写,最后轻微停顿,形成梦幻MV式定格收尾。玄幻特效:最后一个音符化作一圈柔和光波扩散开来,周围粒子缓缓下落,森林恢复宁静但仍保留淡淡辉光。专属音效:尾音悠长的电吉他泛音、森林轻回响、背景音乐留下一段空灵尾音。额外要求:整体统一为唯美高精灵奇幻风格,人物、森林、吉他三者风格必须统一,不要出现现代写实跳风;歌词必须清晰唱出“风穿过林间的时候,我把月光唱给你听。”;不要字幕,不要屏幕文字,不要贴片文案,不要水印,不要 logo,不要 UI 界面,不要画面中出现任何可读文字。建议时长:15秒

下面的案例是火焰小鸟角色设定 + 水晶店铺场景 + 发光宝石道具,三个元素同时参考。

这里对于提示词的遵循是很好的,可以对比提示词和视频。镜头的切换和移动也非常自然。另外,提前建好一整套角色和场景的素材库保存到主体库,后续出不同的剧情镜头就像换排列组合一样,漫剧的生产效率会更高。

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

  • 14

  • 15

  • 16

  • 17

  • 18

  • 19

  • 20

  • 21

  • 22

  • 23

  • 24

  • 25

Shot 1 (0s - 2s):画面描述:中景。[@图2]的古风灵石铺内,木架上摆满发着蓝光、紫光的灵石,烛火轻轻摇曳,空气里漂浮细小灵力尘埃。[@图1]中的玄凤鹦鹉蹲在柜台边缘,身体压低,羽冠微微抖动,左右张望,神情鬼鬼祟祟。运镜设计:镜头从店内缓慢推进,掠过发光灵石和木柜,最后平移停在玄凤鹦鹉身上。玄幻特效:灵石散发柔和微光,空气中有缓慢漂浮的蓝紫色灵尘。专属音效:烛火噼啪声,灵石低微嗡鸣声,木质地板和柜台的轻微环境声。Shot 2 (2s - 4s):画面描述:中近景。玄凤鹦鹉突然盯上[@图3]那块蓝色灵石,眼神一下子变得狡黠,身体一点点前探,小爪子踮起,动作小心又认真。运镜设计:镜头缓慢推近它的脸,再用焦点切换从它的眼睛转到发光的灵石。玄幻特效:蓝色灵石表面轻微脉冲发光,细小星彩粒子围绕漂浮。专属音效:轻微“啾”声,爪子点木面的细碎声,灵石柔和能量声。Shot 3 (4s - 6s):画面描述:特写。玄凤鹦鹉伸出小爪子试探性碰了碰[@图3],确认没事后立刻用两只小爪子和翅膀一起抱住灵石。灵石比它身体还大,它抱起时整只鸟晃了一下,差点失去平衡,表情紧张又滑稽。运镜设计:镜头贴近跟拍偷拿动作,轻微下摇强调它抱着大灵石时的重心不稳。玄幻特效:灵石被碰到时表面泛起一圈淡蓝色波纹,惊起细小灵光粒子。专属音效:灵石轻响,木托摩擦声,羽毛扑腾声,带一点紧张喜剧感的小鼓点。Shot 4 (6s - 8s):画面描述:中景。玄凤鹦鹉终于把[@图3]从木托上偷下来,抱着灵石转身想逃,结果因为太重,走路左摇右晃,尾巴和翅膀拼命维持平衡,但它还是倔强地拖着灵石往前跑,表情又心虚又得意。运镜设计:镜头侧向平移跟拍,低机位跟随它抱着灵石逃跑,最后快速推近它回头偷看的动作。玄幻特效:灵石移动时洒出细碎蓝色光尘,拖出短短的星点尾迹。专属音效:灵石摩擦木面的拖动声,小爪子急促“哒哒”声,扑腾声,背景配乐变得轻快顽皮。Shot 5 (8s - 10s):画面描述:近景。玄凤鹦鹉抱着[@图3]停下,猛地回头看向镜头,圆眼睛睁大,表情同时带着“有没有被发现”的紧张和“我偷到了”的得意,怀里的蓝色灵石把它脸颊和胸口羽毛映出梦幻冷光,形成一个可爱又有记忆点的定格画面。运镜设计:镜头快速推近到它抱着灵石回头的表情特写,并在最精彩的一瞬间短暂停住。玄幻特效:蓝色灵石闪出一圈柔和灵力光环,周围小光粒短暂聚集。专属音效:短促“啾!”、灵石发亮时的清脆叮鸣声,背景音乐俏皮收尾。

下面是大家都很熟悉的漫剧里的大场面打斗案例:主角 + 反派角色 + 符文古剑 + 仙侠战场,多参考叠加。反派角色身上的红色岩浆纹理、古剑上的发光符文、参考场景都安排上了。画面里的粒子爆发和光效流转,也是 Q3 的特效能力在实际场景里的表现。现在生成的时候就直接带上了特效,画面完成度高了很多。

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

  • 14

  • 15

  • 16

  • 17

  • 18

  • 19

  • 20

  • 21

  • 22

  • 23

  • 24

  • 25

  • 26

  • 27

@图1@图2@图3@图4Shot 1 (0s - 3s):画面描述:大全景。残破祭坛悬浮在风暴夜空中,发光法阵铺满地面,远处古殿在雷光里若隐若现。蓝衣男主立于法阵中央,手持发着幽蓝符文光的长剑,黑暗巨兽从对面踏碎地面逼近,碎石与火星被同时掀起,双方正式对峙。运镜设计:镜头从高空俯视缓慢下压,最后落到男主与巨兽之间,建立正面对抗关系。玄幻特效:法阵金红色脉冲发光,男主剑身流动冷蓝符文,巨兽周身翻涌黑红能量。专属音效:狂风、雷鸣、法阵低鸣、巨兽低吼、剑身轻鸣。Shot 2 (3s - 6s):画面描述:中景。巨兽先手猛扑,挥出裹着黑红烈焰的重爪正面压来,男主迅速横剑格挡,硬接这一击,蓝色剑气与黑红爪焰正面撞出强烈火花。男主被震退半步,却立刻拧身反手斩出一道横向蓝色剑光,逼得巨兽侧身闪避。运镜设计:镜头先快速推向巨兽扑击,再横向跟随男主格挡与反斩动作。玄幻特效:碰撞点炸开蓝红光屑,横斩剑光拖出冷蓝长尾。专属音效:重爪破风声、金属格挡声、能量爆闪声、短促怒吼。Shot 3 (6s - 9s):画面描述:中景。巨兽避开横斩后立即回击,张口喷出一股黑红能量冲流直压男主。男主单手掐诀,长剑竖立身前,放出半透明蓝色剑盾挡住冲流,随后借着冲击余势前踏一步,连出两记快速点刺,逼得巨兽抬臂连挡,双方攻防节奏连续不断。运镜设计:镜头围绕双方半环绕,完整拍出`冲流压制-剑盾防御-前踏连刺-巨兽连挡`。玄幻特效:蓝色剑盾表面泛起波纹,黑红冲流撞上后四散成火星与烟屑。专属音效:能量冲刷声、剑盾震鸣声、连刺破空声、护甲碰撞声。Shot 4 (9s - 12s):画面描述:中近景。巨兽怒吼着再次逼近,双臂与角部同时聚能,近身重压;男主不退反进,侧身闪开正面冲撞,贴近巨兽身侧斜斩一剑,巨兽立刻转身甩尾回扫,男主俯身避开后顺势上挑,把战斗从地面打到半空光弧交错的瞬间,真正呈现有来有回的拆招感。运镜设计:镜头贴身跟拍,伴随轻微震动和小幅甩镜,强化近身缠斗节奏。玄幻特效:斜斩与上挑带出两道交叉蓝色弧光,巨兽甩尾拖出黑红残焰。专属音效:甩尾呼啸声、近身斩击声、碎石炸裂声、配乐推高。Shot 5 (12s - 15s):画面描述:中远景。双方短暂拉开距离后同时蓄力,男主持剑前指,巨兽全身黑红裂纹骤亮,下一秒二者再次正面冲撞。男主抓住巨兽出招间隙,侧移卸力后挥出最强一击,蓝色符文剑光压过黑红能量,将巨兽震退数步。巨兽怒吼稳住身形,男主持剑立于法阵中央,双方仍保持对峙,留下余势未尽的收尾。运镜设计:镜头先拉开呈现双向冲锋,再跟随男主最后反制,最终停在双方重新对峙的英雄构图。玄幻特效:蓝色剑光与黑红能量正面撕扯,冲击波点亮整座祭坛,余波化作光粒与火星四散。专属音效:双向冲锋轰鸣、巨大剑光音爆、能量崩散声、配乐收在高燃尾音。额外要求:重点表现双方拆招与反制,必须清楚看到`巨兽先攻、男主格挡反斩、巨兽远程压制、男主防住再突进、双方近身拆招、最后男主抓破绽震退巨兽`的完整来回;不要字幕,不要屏幕文字,不要贴片文案,不要水印,不要 logo,不要 UI 界面,不要画面中出现任何可读文字。

再加上 Vidu Q3 的音画同步音效能力,打斗有碰撞声,环境有氛围音,情绪紧张的时候有轰鸣,漫剧的“看片感”比纯哑巴画面强了太多。对漫剧团队来说,这意味着有了角色和场景概念图,就能直接出视频镜头了,省掉了大量中间环节。

说来好笑,这个我本来是在玩梗,然后随手尝试了一下车的视频效果的。

这是玩梗,玩梗少不了噜噜

打开网易新闻 查看精彩图片

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10

  • 11

  • 12

  • 13

  • 14

  • 15

  • 16

  • 17

  • 18

  • 19

  • 20

  • 21

  • 22

  • 23

  • 24

  • 25

  • 26

Shot 1 (0s - 3s):画面描述:大全景。[@图3]的海边公路在阳光下向远处蜿蜒伸展,右侧是闪烁着碎金光的海面,左侧是起伏山坡与电线杆。[@图2]中的红色敞篷跑车从远处高速驶来,车漆在阳光下明亮反光,速度感强,整条公路充满假期出发的兴奋气息。运镜设计:镜头先以高位大全景俯拍海岸公路,再顺着公路方向缓慢下压并跟上跑车前进轨迹,建立大场面和速度感。特效设计:阳光在海面形成高亮闪烁反射,跑车车身边缘有流畅高光,空气中带轻微热浪感。专属音效:海风声、海浪声、跑车引擎由远及近的轰鸣声、轻快热烈的出行感背景音乐。Shot 2 (3s - 6s):画面描述:中远景转跟车镜头。跑车沿海边公路高速驰骋,镜头切到车身侧后方,清楚看到红色敞篷车流畅的车身线条、轮胎飞快滚动和海岸线在旁边快速倒退,主角[@图1]坐在驾驶位,身体微微前倾,显得很投入、很享受这段旅程。运镜设计:镜头贴近车身做高速跟拍,保持跑车主体稳定,背景海面和护栏快速掠过,突出驰骋感。特效设计:阳光掠过车身形成连续流动高光,路面和护栏在速度中带轻微运动模糊。专属音效:强劲引擎声、轮胎压过路面的滚动声、持续海风声,背景音乐节奏明显增强。Shot 3 (6s - 9s):画面描述:中景。镜头切到跑车正前方略低机位,红色敞篷车迎着镜头高速驶来,主角坐在驾驶位上,神情特别开心兴奋,像正在奔赴节日旅行。海风把车内氛围吹得更轻快,蓝天白云和闪亮海面构成很有冲击力的度假感画面。运镜设计:镜头低机位迎车跟拍,再略微抬起一点角度,强化跑车冲击力和人物的热情状态。特效设计:阳光在挡风玻璃和车头上形成跳跃高光,背景天空和海面干净明亮。专属音效:引擎轰鸣更靠前,海风声加大,背景音乐进入最轻快的一段。Shot 4 (9s - 12s):画面描述:近景特写。镜头切到主角[@图1]的上半身和面部特写,能清楚看到她在驾驶中的开心表情,身体随着车速和情绪轻轻前倾,眼睛发亮,带着很强的兴奋感,对着镜头或者前方开心喊出:“五一五一快来喽~”台词语气要轻快、雀跃、像真的在迎接假期。运镜设计:镜头贴近主角面部和上半身特写,轻微跟随车身晃动,保持真实行驶中的临场感。特效设计:阳光在主角脸部和车内边缘形成明亮高光,背景海天被压成柔和流动的速度感虚化。专属音效:主角清晰兴奋的台词声“五一五一快来喽~”,风声从车旁掠过,引擎声保持但适当压低,为台词让位。Shot 5 (12s - 15s):画面描述:大全景转中远景。跑车继续沿着海边公路向远处冲去,镜头再次拉开,看到红色敞篷车在蓝天、白云、山坡和大海之间一路驰骋,整段画面像假期旅行宣传片的热血收尾,充满自由、阳光和奔赴快乐的感觉。运镜设计:镜头从近景快速切回拉远的大场景跟拍,再略微升高视角,看着跑车沿公路弯道继续飞驰向远方。特效设计:海面反光和天空层次丰富,跑车车尾带出干净利落的速度感,整体色彩明亮通透。专属音效:引擎声再次拉满,海浪与风声持续,背景音乐收在一个轻快高昂的尾音上。额外要求:公路驰骋过程中要切换多个角度,明确表现海边公路、大海、跑车速度感和主角的开心兴奋状态;台词必须清晰说出“五一~五一快来喽~”,语气活泼雀跃;不要字幕,不要屏幕文字,不要贴片文案,不要水印,不要 logo,不要 UI 界面,不要画面中出现任何可读文字。

初衷是玩梗,但后面发现车的视频片段还挺好的哈哈哈所以剪吧剪吧放一起了。Vidu 还有一点很好的就是从 1 秒到 16 秒都可以选,我这里做的时候很多镜头就选了两三秒也都挺好的

参考生视频的价值在于,产品形态锁定后,只需要换场景、换运镜就能快速出多个版本的素材。现在至少在创意验证和初稿阶段,通过参考生视频可以看到非常多样的效果呈现,大幅缩短周期。

短剧和影视

仙侠方向,比如基于白衣女角色 + 月下蝴蝶群的图片素材生成视频,特效和角色融合得也比较自然。这种仙侠美学的镜头以前后期成本很高,现在参考生视频加特效就能直接出,对仙侠类 AI 短剧来说是实实在在的降本

打开网易新闻 查看精彩图片

  • 1

[@图1]立于[@图2]的月夜森林中央,白衣轻盈,长发与衣袖被夜风缓缓吹起,神情平静而清冷,直视前方。四周原本零散漂浮的纸片与微光碎屑,忽然在雾气中迅速汇聚,化作大量白色纸蝴蝶,从她身后、脚边和林间深处不断飞出,层层盘旋升起。成群的纸蝴蝶在她周围形成巨大的环形流动,有的贴近镜头掠过,有的从她肩侧和发梢旁穿行,有的在月光下翻折闪光,前景、中景、远景都充满密集飞舞的纸蝴蝶,画面梦幻而震撼。背景是幽暗森林、冷蓝月光、缭绕白雾和微弱星点,空气中漂浮细小光粒,整体氛围空灵、神秘、唯美,带强烈东方奇幻气质。环境音为持续轻柔风声、雾气流动的低微气流声、纸蝴蝶密集振动时细碎的沙沙声与掠过镜头的 flutter 声,背景音乐为空灵古风氛围配乐,带淡淡女声吟唱、轻柔弦乐和若有若无的钟铃泛音。镜头先缓慢推近人物,再轻微环绕,随后跟随纸蝴蝶群向前穿行,画面稳定,浅景深,电影感。

科幻方向也试了。角色穿上机甲、机甲穿越传送门的效果很酷,科幻题材的短剧和影视预演也能拿捏住。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

音效

前面聊的都是画面,其实音效方面 Vidu Q3 也是进步挺大,悄悄变得更强了。

下面这段视频里有好几个完全不同的场景,热带雨林里有虫鸣、雨滴落在叶子上的声音;草原上暴风雨压过来,风声和雷声跟着云层走;魔法古书翻开,蜡烛噼啪响,金色粒子升腾的时候有那种轻微的嗡鸣;月夜大树上萤火虫飞舞,配的是虫鸣和夜风;蜂蜜淋在松饼上,那个黏稠的浇淌声很真实;揉面团的手掌按压声也对得上动作节奏;最后那个废弃医院走廊,灯管闪烁嗡嗡响,脚步声从远处传来(温馨提醒注意音量)……

每个场景的声音都不一样,而且是跟着画面内容走的,完全不是后贴上去的罐头音效。

同一段视频,有声和没声完全是两个东西。尤其做漫剧和短剧的朋友,以前生成完视频还得自己去找音效、对时间轴,现在这一步直接省了。

小结

尝试这一圈下来,Vidu Q3 给我最大的感受是 AI 视频已经完全进入能配合生产流程的阶段了。

文生视频、图生视频、参考生视频三大能力形成了 Vidu Q3 全家桶。

参考生视频让角色、场景、服化道都能被复用和组合;特效让画面不再需要大量后期合成;音效补齐了有声音这个基础体验。这三个能力叠加在一起,完全可以改变内容生产的工作方式。

目前 Vidu 的 Agent、Claw 和官网等平台都已经全面接入 Vidu Q3,价格据说是行业平均的三分之一,想尝试的朋友可以直接登录Vidu.cn,新注册可以输入阿真的邀请码AZHEN,注册送 500 积分。回血靠大家了,感恩(´ᴗ`ʃƪ)

好了,今天的分享就到这里啦。如果大家也在用 AI 视频工具或者对参考生视频这个方向感兴趣,欢迎评论区一起聊聊你们的使用体验和想法。觉得内容有趣或有用的话,欢迎猛猛三连 鼓励阿真,这对阿真真的很重要~

下期见~