从最差 AI 图像中，拯救那些重大失败案例|ai|皮卡丘

我使用 AI 图像生成器的时间比一般人要多。我已经评测了几个程序，对它们进行了排名和筛选，挑出了其中最好的，并且我已经掌握了AI 图像提示工程的最佳实践，以获得更好的结果。在这整个过程中，我生成了数百张 AI 图像。有些图像美丽且细节惊人，而有些则很糟糕。另外，它们可能很怪异、古怪、令人恐惧或由于其他原因无法使用。

每张不好的 AI 图像都有其独特性，但在我的测试和评测过程中，我发现不同的服务存在类似的问题。AI 图像生成器容易在某些细节上出错，也有一些技巧可以用来弥补。这些策略都不是完美的——它们很大程度上取决于您正在使用的生成器——但它们是一个很好的起点。

请记住，没有任何 AI 艺术服务可以复制或取代人类创作者。如果您正在使用 AI 图像生成器，以下是我发现的最大问题以及如何解决它们。

人脸和表情

准确的面部表情一直是 AI 生成器面临的挑战。怪异的眼睛、牙齿和眉毛是表明图像由 AI 生成的一些最明显的标志。在这种情况下，结果对我来说非常有趣，不过也是完全无法使用的。女孩们露出了一些类似万圣节吸血鬼的牙齿，后面的那个家伙头发糟透了。

即使是卡通或非现实人物，生成器在调控情绪和表情方面也颇为吃力。这张图片——由我们的最佳选择 Dall-E 3 生成——过度放大了所给的提示，最终的结果显得过于戏剧化。我自认为有洁癖，但我无法想象有人会因为看起来价值数百美元的清洁用品而如此沮丧。即使是最好的程序也可能失败并产生不稳定的结果。

如何解决：我建议要求服务减少其试图渲染的人数——减少出现错误的几率——并使用生成后的编辑工具选择需要重新生成或修复的图像的特定部分。选择一个更温和的形容词（比如“生气”而非“愤怒”）或许有助于引导服务步入正轨。

标志性人物、商标和可识别的标志

出于多种原因，人工智能图像生成器很少能够生成准确的标志、知名商标或者其他可识别的人物形象。这通常是因为公司允许其品牌材料或知识产权用于人工智能服务存在重大法律问题。也可能是因为您想要包含的标志或品牌不在生成器的训练数据中，因此生成器无法理解您的请求。

最近有两个例外情况，即谷歌 Pixel 9 和 Pixel 9 XL 上的新图像生成功能，这要归功于 Gemini AI，我们的移动专家曾借助它来创建图像，其中包含了看起来逼真的米老鼠和皮卡丘形象。另一个例外是，一些付费的 X（此前称为 Twitter）用户称，他们可以使用该社交媒体网站的 Grok 聊天机器人来制作看起来逼真的米老鼠和人类政治人物。这些图像仍然不是完美的渲染，但已经非常接近了。

如何解决: 您无法解决，但从好的方面来说，您因版权侵权而遭遇诉讼的可能性会小很多。要是您碰到这个问题，我建议您重新琢磨一下设计概念，瞧瞧能不能在不使用特定公司名称或徽标的情况下表达出相同的意思。例如，您真的需要 TikTok 徽标，还是只需要一部播放垂直视频的手机。

重叠、复杂的元素

偶尔，如果图像中存在过多重叠或复杂的元素，会把生成器难住。最好的 AI 图像程序不会经常遇到这个问题，但即使是最好的程序有时也会失败。在这张莱昂纳多的图像中，我梦想中的图书馆被中途消失的滚动梯子毁了。

同样，这张厨房的超逼真照片乍一看还行，但再仔细看一眼或者快速放大，就会发现食谱上印着毫无意义的字符，而且这本书本身好像有两个书脊和三个部分。像这样的图片表明了创建人工智能图像是多么让人感到沮丧，就算你觉得自己得到了一张不错的图片，一些小瑕疵也会让它没法用。

怎么解决: 试着简化您的提示，或者用生成后的编辑工具把问题找出来并解决掉。有时改变一下美学风格也能帮上忙；当您想要制作逼真的或者库存图片的时候，这些问题通常就会冒出来。如果您的服务提供特定区域编辑工具，请尝试使用它选择有问题的区域，并要求生成器删除其中的内容。

过度编辑和幻觉

一个优秀的人工智能图像生成器的标志在于，它能生成几乎没错误或者没幻觉的图像，同时给您提供正确的工具来解决不可避免出现的这些问题，不过并不是每项服务都能做到。在 Midjourney 的这个例子里，我对这张足球队庆祝胜利的图片做了好几轮编辑，我不知道最后得到这个结果是咋回事，也不晓得图片右侧那个大概是球员的斑点是啥情况。坦白讲，我觉得 Midjourney 也不晓得。

如何解决: 在对 AI 图像进行编辑时，有时少反而更好。