最近琢磨事群里,大家在秀自己的各种产出,我就也顺道拿视频参与了下,试了试基模的能力。
试完后最大感慨就是:AI折叠速度太快了,再不从业务回看技术(无人公司是这个视角),还是从技术看业务就真太危险了。
下面上一些结果,这是纯粹使用体验,不专业,不是评测,不整成懂车帝那样。
我不会做视频剪辑,所以下面的所有内容全部靠基模。
1. 20s的人物短视频
这个视频过程是用GPT生成了一张皮克斯风格的图,然后可灵图生视频,声音是自己录后对的口型。
总计大概花了10多块钱,用时10~20分钟(不算等待的时间),也不算文案时间。
没写任何复杂提示词,就正常和人说话一样完成的。
语音合成比较拉胯,和当年做智能音箱的时候差别不大,还得自己录。GPT精修人物形象比较拉胯,比如会把人物修成这样...
2. 带视觉效果的视频
这是veo 3,也没设计复杂提示词,就是给了篇文章,让它匹配一段视频。
文章类似这篇:
这个也啥也没干,就是把上面文章的段落给模型了。
上面这视频也是没干什么,就是扔了上面的文章的一段给模型,模型自己设计提示词,自己生成。
这个模型能力还是很好的,比Sora好,但是没啥配套的辅助工具,我又不会剪辑,就扔在哪儿了。
3. 文字问题看起来也接近解决
群里大家还很是贡献了点其它创意,比如:
大家看起来都是用qwen image和豆包整的。文字是个神烦的问题,如果能解决就真的很好。
这里面十分要命的点是:每个这种改善估计都有N个团队做过N种工具吧。可基础模型一进步,这些工具的价值就真的会大幅削减。
从业务看AI,AI是成本,AI越进展能做的业务越多;从技术看AI,AI是能力,能力在AGI面前只可能加速贬值。
动笔写无人公司,基本上是基于这个初衷,它应该是很少的从业务看AI的书吧。
注:入群或者加入AI碰撞局,联系:shuixiu2024
热门跟贴