大家好,我是梧桉,这是更新的第337篇文章!

点击名片,一起拆爆款、建认知、破焦虑

写在开头

之前写过一篇文章是反推解析视频提示词的,因为页面直接调用模型,粉丝反馈使用都不稳定,超时报错,后来大家教的多数是gemini反推视频提示词,很多人用不了,国内的AI工具多数都不支持上传视频解析的。

但阿里上线了Qwen3.5-Omni,一个多模态AI模型,它不再需要你费力去翻译你的想法。能直接看懂你的视频,听懂你的语音,甚至通过摄像头捕捉你当下的情绪。把那个需要反复调试、不断试错的黑色盒子,变成了一面能实时反馈的镜子。

下边用4个实测场景带大家体验下这个新模型,你们看完一定会有收获,哈哈哈。

文章目录

1.反推视频提示词

2.反推图片提示词

3.语音视频通话

4. Vibe Coding

反推视频提示词

1.登录官网,选择模型Qwen3.5-Omni-Plus

https://chat.qwen.ai/

打开网易新闻 查看精彩图片

2.上传你想学习的视频,输入提示词,可以点麦克风口述,表达出自己想重点学习的部分内容

输入提示词:

去看一遍视频,把每一个分析女生的表情,她的表达的情感,然后嗯,叙事全部都罗列出来,告诉我每一秒的变化。

你就会得到一个详细解析视频的结果,可以逐帧学习,

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

反推的文生视频提示词,用seedance2.0生成效果 如下

反推图片提示词

1.视频都能反推,图片肯定也可以,同样的步骤上传想学习的图片,输入提示词

输入提示词:

请你详细描述这张图的文生图提示词,非常详细的描述出来所有关键参数

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

文生图提示词:

Ultra-detailed luxurious floral pattern design, full-frame composition of large peony-like flowers with layered translucent petals in coral orange, soft peach, and muted teal colors, each petal outlined with irregular liquid gold kintsugi-style edging that glows under soft ambient light, intricate golden stamen at center of each flower resembling fine brushstroke filaments, abstract teal leaves interspersed between blooms also edged in gold, background is warm terracotta red with subtle vintage paper texture and faint ink wash stains, overall aesthetic blends Art Deco elegance with traditional Chinese imperial ornamentation, 3D embossed relief effect giving depth to flowers, porcelain glaze finish on petals with internal marbling patterns, hyper-realistic material rendering: metallic gold foil, semi-transparent resin, matte ceramic base, cinematic lighting with global illumination and gentle bloom highlights, no shadows, flat decorative style suitable for textile or wallpaper design

反推出来的提示词去midjourney生成效果如下,效果接近原图90%

打开网易新闻 查看精彩图片

语音对话

1.语音和视频对话都可以支持,目前不支持屏幕共享,适合不想或者不方便打字的人直接语音对话来提问,同步语音转文字到对话框的

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

2.点开语音通话,左下角有三条横线,可以选择不同音色语种

打开网易新闻 查看精彩图片

3.支持多国语言语种,包括方言

打开网易新闻 查看精彩图片

这个语音模式应用场景是可以拓展的,比如你配音喜欢里面的音色,你可以给文案让他朗读出来录屏录音,可以语音对话锻炼其他国家语言口语,剩下的你们可以慢慢挖掘。

Vibe Coding

Vibe Coding看着很专业的名词,简单来说就小工具网页的开发,以前也写过类似的。例如很多同学说不会写首尾帧提示词,今天用这个模型来演示下,普通小白如何用最普通的语言做一个首尾帧提示词应用工具,对话框直接输入提示词

我是一个 AI 视频创作者。我需要做一个简单的网页工具,叫‘首尾帧转场提示词生成器’。

界面要有两个图片上传区(首帧和尾帧),下面有一个‘生成转场逻辑’按钮。

点击后,调用你的逻辑,分析两张图的差异,输出一段包含运镜方式、光影变化、材质转化的动态提示词。

风格要暗黑堕落风,背景用深灰,按钮用暗金色。请直接给我完整的 HTML/CSS/JS 代码,我要能直接在浏览器打开运行

打开网易新闻 查看精彩图片

自动写出工具代码,不需要看得懂,也可以做出工具。

等模型代码写完之后操作步骤如下:

1.在电脑桌面新建一个txt文档

2.复制这个代码保存到txt文档里

3.重命名txt文档,删除txt,文件格式改成.html的

4.就得到一个这样的工具页面,上传两张照片,点击生成可以生成首尾帧转场提示词

打开网易新闻 查看精彩图片

这只是初步演示,比如页面你要中文,比如提示词要中文,都可以在对话框里直接说需求让模型自己来改代码的。

最后

Qwen3.5-Omni专为原生文本、图像、音频和视频理解而设计,在智能和实时交互方面均取得重大突破。不仅能理解文字、图片、音频和视频,还能实时响应你的语音和摄像头输入,甚至能根据你口述的直接生成代码或网站(Vibe Coding)。重点是开源免费可以用,如果你们自己不知道这些信息差,可能未来就是别人用这套开源做一套AI工具去品宣去收会员费了。

当我们回顾这一系列操作,会发现一个本质的变化。过去我们是在适应工具,为了迁就模型的局限性而不断压缩自己的创意边界。我们小心翼翼地避开那些模型不擅长的领域,在有限的框架内修修补补。而现在,工具开始适应我们。它理解我们的模糊表达,补全我们的逻辑缺口,甚至预判我们的潜在需求。这种转变不仅仅是效率的提升,更是创作权力的回归。

未来的 AI 视频赛道,拼的不再是谁的提示词写得长,谁的插件装得多。拼的是谁的审美更独特,谁的叙事更有张力,谁能更快地将脑海中的画面变现为现实。当你还在纠结某个形容词是否准确时,别人已经用语音指令完成了整部短剧的雏形。当你还在手动逐帧调整光影时,别人已经通过视觉逆向工程复刻了顶级大片的质感。

实操过程中有问题可以在练习群@我一起交流,祝大家流量大爆。如果遇到自己想学的AI视频赛道,也欢迎大家踊跃投稿!!

Qwen3.5-Omni

结尾

打开网易新闻 查看精彩图片

往期内容合集