像大多数冒险那样,它始于没有过多考虑曲折之路会将我带往何方。我踏上未知之旅,为期六个月,或者只要“感觉合适”就好。那是八年前的事了,最终我离家超过一万英里。
如今,人工智能为我提供了一种与世界另一端的家人保持联系的创新方式,让他们得以略窥我离家的生活。
在跨越大陆三年后,我落脚纽约市,为其活力所倾倒。作家爱上纽约市——这故事多有创意啊。
尽管家人和朋友为我终于找到那个与我心灵契合的城市而感到高兴,但不久后悲伤随之而来。因为去看望亲人不是一次短途旅行或飞行就能做到的。
我通常每年回家一次,并经常与家人和亲密的朋友通话,但时差使得即兴聊天颇具挑战性。在一天的工作结束后,我最不愿意做的事情就是在晚上 8 点进行 FaceTime 通话,无论我的侄子们有多可爱,我有多么想念澳大利亚的闲聊。
我发现自己更多地进行音频通话,因为这样更省力。视频通话是我能够尽量模拟面对面体验的方式,我意识到不能损害我的人际关系。我需要一些创新的方式来进行远程连接,也要以新的异步方式进行。
我想,用人工智能为我的侄子们制作一部迷你电影,会不会很酷呢?我在 Midjourney 和 Dall-E 之间犹豫不决,但最终决定选择 Dall-E,因为新版本可以通过ChatGPT Plus 使用。
Dall-E 3 是 OpenAI 最新的文本转图像模型,OpenAI 也是ChatGPT的创造者。它于 2021 年 1 月首次发布,目前已进入第三个版本。
九岁、八岁和五岁的孩子们在追什么?《布鲁伊》。我想看看我能否创作一个受《布鲁伊》启发的迷你剧集,由我和我的侄子们主演。
这是它创作的七场剧本的前两场:
非常不错!我的侄子们已经写信给他们的老师,说他们迫不及待地想来美国看我,看看高楼大厦、桥梁和人们,所以我让 ChatGPT 加上了这些内容。
这跟我已经喜欢的东西很接近了,但我还是稍微调整了一下,想让它更有个性和关联性。其中有一句话听起来像是我已经不在人世了,所以我把它给改了。
接下来,我把所有的插画提示都复制到一个文档里,然后粘贴到 ChatGPT 里。我一开始是把所有提示一次性放进去的,但后来决定一次做一个,这样我就可以给出反馈,比如我想把头发颜色改成金色。一次放进去的话,角色就会缺乏一致性,一张画里是短发,下一张画里又变成了长发和刘海。
我试了好几次才让它明白我的需求。它老是给我添加一些我没要的角色。
比如说,我喜欢一个画面,但是又得让它把布鲁伊加进画里。然后我们家突然就变成了混血家庭,侄子从三个变成了两个。
Dall-E 继续迷迷糊糊的。我让它用右边照片里的角色来做剩下的视觉效果。结果我的侄子头发突然就变成棕色了......还变成了青少年。
担心插画之间缺乏一致性,我决定把所有内容都放在一个提示中,但要首先描述一下身体特征。
然而并没有那么幸运。在一个系列中,我先是从一个时髦的中年妇女,变成了一个黑人少年,然后是一个名叫“阿姨邦戈”的老年妇女。
在这个阶段,我准备放弃,回到传统的 FaceTime。
我回到了第一批图片,讽刺的是,除了刘海,这些图片是最好的。Dall-E 把布鲁伊变成了一个宝贝。
我保存了每一张图片,然后上传了我想要编辑的图片,并提供了反馈。这个策略似乎奏效了,但我不得不接受一些不一致之处,因为 Dall-E 不断回溯,或者把我变成了一个有六个侄子的老年妇女。
这时这变得很滑稽,所以我只好接受它的不完美。
我得把这些视觉效果转成视频。我原以为都能在 Dall-E 中搞定,但不得不用上外部的免费工具Pika。为求简便,我就弄了些稍带动态的动画,没啥太夸张的。
接着,我把所有旁白文字都复制进一个文档,再粘贴到免费的 AI 配音工具 ElevenLabs 里。我挑了个喜欢的声音,生成并下载了配音。脚本太长了,所以还得精简一下。
在 Vimeo 上,我上传了全部动画和配音——你可以在这儿观看最终成果。它并不完美,而且从开始到完成花了好几个小时,但这是个有趣的小数字礼物,能给他们个惊喜,让他们知道我想他们了。
或者可能会逗他们笑。两种情况都是好事。
但我短期内可不会放弃 FaceTime。
热门跟贴