不圆 发自 凹非寺
量子位 | 公众号 QbitAI

最近AI生图赛道简直卷疯了!

从Nano Banana的爆火,到即梦AI 4.0,豆包4.0接连上线,一直专注于视频大模型的Vidu也按捺不住了:

Vidu Q1参考生图堂堂登场!同时支持7张参考。

主体一致性比起谷歌Nano Banana也毫不逊色。

(Nano Banana最多支持3张参考图)

打开网易新闻 查看精彩图片

量子位抢先实测了这款模型,它的表现相当不错——能够自由引用的7张参考图,带来了极高的可操作性。

用简单的自然语言描述即可。

打开网易新闻 查看精彩图片

或者是直接生成时尚大片,现场拍摄啥的都省了。

打开网易新闻 查看精彩图片

我们探索了很多有趣的玩法,提示词、图片都放在下面了,一起来看一下!

7张参考图,能怎么玩?

我们实测了几种玩法,比如让各种违和的元素凑成一张和谐的画面、或者是制作时尚大片……

可以说,只要有创意,万物皆可合成。

万物皆可合成

无论是让秦始皇骑北极熊在上海喝柠檬水:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

还是让李白坐火箭成功登月:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

参考图一放,就看Vidu Q1参考生图的结果是否符合想象。

潮流单品秒变OOTD

既然有那么多参考,岂不是可以直接全套换装?

所有单品一键上身,是时候展现搭配之力了(摩拳擦掌)。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

用这套提示词,不管是地中海还是西海岸通通可行。

在线试衣再也不是问题。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

一个人也能拍时尚大片

光是换装还不够,更进一步,生成一张海报级别的写真如何?

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

看,只需要简单的提示词,背景、光影、构图都可以随意调整。

合照?不,是大合照

双人合照已经满足不了需求了,来点更多的?

让少年漫主角齐聚一堂怎么样。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

即使画风差别过大,甚至跨了一个次元,也可以自然地出现在同一个画面里。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

更多玩法等待探索

当然,更有趣的玩法还有很多。

基本上Nano banana能做的,Vidu Q1参考生图也可以。

无论是小某书爆火的手办生成。

打开网易新闻 查看精彩图片

还是设计稿变3D立体效果。

打开网易新闻 查看精彩图片

又或者最经典的主体替换。

打开网易新闻 查看精彩图片

同类产品多数仅支持1-3张参考图,且很多不能支持同一类型的多元素参考,比如同时参考多个人物。

而Vidu Q1参考生图可同时支持7张参考图,并在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。

打开网易新闻 查看精彩图片

测试数据全面超越Flux Kontext,直接对标Nano Banana。

一致性能力评分全场最佳。

打开网易新闻 查看精彩图片

最后让我们简单介绍一下Vidu Q1参考生图的使用方法。

在参考生图页面,支持7张参考图片,上传后会显示在下方的输入栏,可以拖动和更改提示词。

也可以输入【@】选择图片。

打开网易新闻 查看精彩图片

点击创建主体可以输入自己的常用数据,或许三视图效果更佳。

打开网易新闻 查看精彩图片

目前仅有1080p分辨率,可选择生成图片的宽高比和生成数量,最多可一次生成4张。

打开网易新闻 查看精彩图片

Vidu Q1参考生图现已全球同步上线,欢迎大家在评论区分享自己的作品~

实测地址:https://www.vidu.cn/create/reference2image