Gemini 2.5 Pro 真挺惨的,
明明在 Arena 排行榜比 GPT4.5 高了40分,却被 GPT4o 生图给盖过去了,隔壁拖更王 Midjourney 预告了无数遍的新货也推迟发了。
虽然我才刚刚测完横评100镜,
但还是会被一些脑洞玩法吸引了。一下午啥都没干,光坐电脑前生图了,这几天我用 Sora 的频率比它刚上线我氪了2000的时候都多。
大家看看 @PJaccetturo 做的吉卜力版指环王
方法也很简单,从原视频截图后,通过提示语转风格,再用 Kling 或者 luma 生成视频片段,最后剪辑而成。
Recreate this in the style of Studio Ghibli, intricately detailed. Make sure the composition, colors and vibe is similar. [具体画面描述]感叹之后,我觉得马上出一期和大家盘点一下GPT4o的脑洞用法们,当然是完整带提示语和效果展示,Here we go!
1. 海报/字体设计
第一类是以平面设计为主,这一类主要是依赖风格模仿的准确性。
字体类就很好理解了,可以模仿具体的设计,也可以融合两个不同的设计风格。
接下来就是海报类,看看 @宝玉老师 出的这个例子:
提示词:
复古宣传海报风格,突出中文文字,背景为红黄放射状图案。画面中心位置有一位美丽的年轻女性,以精致复古风格绘制,面带微笑,气质优雅,具有亲和力。主题是GPT最新AI绘画服务的广告促销,强调‘惊爆价9.9/张’、‘适用各种场景、图像融合、局部重绘’、‘每张提交3次修改’、‘AI直出效果,无需修改’,底部醒目标注‘有意向点右下“我想要”’,右下角绘制一个手指点击按钮动作,左下角展示OpenAI标志。 椰树牌椰汁风格广告海报,主题是GPT最新AI绘画服务的广告促销,强调‘惊爆价9.9/张'、‘适用各种场景、图像融合、局部重绘'、‘每张提交3次修改'、'AI直出效果,无需修改',底部醒目标注'有意向点右下"我想要"",右下角绘制一个手指点击按钮动作,左下角展示OpenAI标志。感觉这个海报要是当商品图的话我路过不买都要点进去看看。。。属于是文艺复兴了。
常规的视觉设计里除了纯文字外,还会用更多的元素来表达主题,比方说我们以前会看到的一些网站页面的宣传展示:
用手机作为一个天然的视觉中心来展示产品也是一个相当不错的思路,现在4o也可以非常轻易的做到。
@歸藏 就实现了将展示图和手机图放在一起,只需要一步就行:
将第二张图片的UI设计稿放在第一张的手机样机里面展示
2. 商品翻译/人像合成
我昨天看到非常有看点的,就是 @银海 做的这个。
提示语:
结合上面的结构信息,把里面的商品主图改成我这个鞋子你就会收获这个图,不过太小的字会乱,最好多抽几次,或者选择模版的时候有倾向性一点。
如果你想在电商模特图里换脸、衣服、商品的话,同样简单啊,直接指定就好,没啥技术难度。
帮我把图1中的产品替换成图2中的产品,图1中的模特脸换成图4中的模特脸,图1中的模特衣服换成图3中的模特衣服
3. 复杂四格漫画
第三类我最感兴趣的是以概念解析、主题表达为主的复杂四格漫画,尤其是画风很上头,是我路过都会停下来仔细看看的程度,图片里面的文字多了,包含的信息也足够丰富。
@宝玉 老师出的这个提示语是真好玩,建议用 sora 里 GPT-4o,一次性抽好几张,增加成功率:
经典的“Out the Window” Meme 四格漫画竖版布局,标题在漫画顶部居中,背景为现代办公会议室场景,风格简洁、幽默、清晰易懂,所有人物均以卡通风格表现,适合用于网络传播。 ### 标题(居中): 《如何借助 AI 提升开发效率?》(中文,加粗) ### 第一格(完整横格): - **场景**:公司会议室,老板站立在白板或投影幕前讲话,老板为分头发型、西装领带、严肃但略带疑惑的男性(参考图1)。 - **动作**:老板张开双手,似在询问,下方桌前并排坐着三位员工(从左到右:小明、小红、小互)。 - **对话气泡(老板)**:“我们要如何借助 AI 提升开发效率?” - **员工描述**: - 小明(程序员):男性,蓝色格子衬衫,戴眼镜,程序员气质。 - 小红(设计师):女性,休闲时尚穿搭,显出设计师的个性气质。 - 小互(测试员):女性,戴圆眼镜,职场休闲风(参考图2)。 ### 第二格(完整横格,画面中三个员工分别给出回答,表情认真自信): - **小明(左侧)对话气泡**:“我们用 AI 写单元测试。” - **小红(中间)对话气泡**:“我们用 AI 做代码审查。” - **小互(右侧)对话气泡**:“Vibe Coding。” ### 第三格(下半行左侧小格): - **老板特写镜头**,表情从严肃转为愤怒,面容阴沉,额头出现愤怒的青筋或“井”字符号。 ### 第四格(下半行右侧小格): - **场景切换到大楼外景**,高层窗户打开,眼镜女性员工小互夸张地被老板扔出窗外,表现幽默的动态姿势,小互表情惊讶并带有喜剧效果,窗内老板依然维持愤怒的表情和姿势。 --- ### 附加风格要求(可选但推荐): - 人物绘制:卡通化、线条清晰明快,颜色鲜明易辨,易于网络传播。 - 对话气泡:中文文字,字体清晰、大小适中且统一,采用黑色文字、白色背景的标准漫画气泡。如果你跟我一样,不想做前置的图片素材的话,
宝玉老师还有一个更简单的版本,不需要参考图,直接通过文字的描述来一步步生成。
画一张彩色科普漫画,主题是:“什么是扩散式图像生成?” 请参考下面的内容来生成 我们先从“扩散”这个词开始拆解: - “扩”(Diffusion) 可以理解为向图像中逐步加入噪点,让原本清晰的图像变得越来越模糊; - “散”(Process) 表示在反向过程中学习如何一点点去除噪点,从而得到清晰的最终图像。 打个简单比方: > 你有一张非常清晰的照片,然后故意往上面撒细小的粉末,让照片越来越模糊,直到几乎看不出内容; > 接着,你再通过学习到的“去噪”手法,一点点把粉末清除,慢慢让照片恢复清晰。 扩散式模型的核心思想与这个“加噪-去噪”的过程非常类似。具体到GPT-4o类模型,就是: - 模型首先在随机噪声中开始,然后一步步减少噪声的程度; - 每次去噪时,都参考当前模糊图像已有的像素信息,预测并生成更清晰的细节; - 经过多次迭代,最终生成一张完整且清晰的新图像。 假如你让AI画一只狗狗: - 模型先从一团近乎随机的噪声中开始,看起来根本不像狗; - 每一步去噪,都逐渐显现出狗狗的轮廓、耳朵、毛发等细节; - 最终合成一只栩栩如生的小狗,呈现在你的面前。4. 复杂 UI 快速设计
下一个品类就是复杂的UI设计,比起海报有更大的页面,需要不同的元素:文字、人物、色块、交互方式等等结合。
我就找到了一个超快速不需要前置知识的 UI 设计方法,在支持联网搜索的 AI 应用里面输入:
为 的 Web 应用创建一个设计概要概念然后将设计概念直接丢给GPT-4o就好,不需要修改。
5. 百科/单词闪卡
通过 GPT4o 生图还可以当作学习工具,
尤其是现在问某种概念的时候已经习惯性用 AI。
创建图片:维基百科猫咪页面截图,包含图片和关于猫咪如何运作的适当解释
平时背单词的时候也可以多多用 4o。
6. 室内装修模拟
刚好我最近想重新装修一下我的拍摄场景,
合理使用灯光和增加纵深感,但是不知道怎么搭配大件或者小件。
小件的话可以将计划要搭配的物件一次性生成,看看一个日本博主生成的案例:
请参考 pegboard(洞洞板)的图片,在房间的照片中安装一块相同颜色的 pegboard,然后将键盘、MacBook、耳机等挂在上面,制作出完成后的预想图像。
大件可以直接多图融合,
我是一名家具搭配师,我需要为这些产品搭配效果图,请 把这些产品放到适合他们的场景里面
7. 表情包
表情包就是纯粹的好玩,相当好玩。@小互 给出了很详细的教程,流程基本都是上传一个形象,可以是 Q版、3D的小人 or 动物。
提取该形象,制作一系列搞怪好玩的表情包
8. 矢量化处理
因为目前GPT4o直出的图片清晰度和编辑性上还可以更进一步,
所以最后一个来点更干的货,就是将4o输出的图片转矢量化。
方法很简单,将图片导入recraft.ai,右键点击图片就可以直接选Vectorize就行了,而且 Recraft 还可以高清图片,算是补上了目前4o的一个硬伤。
下载下来后可以导入PS,完成替换颜色等操作。
还有惊喜?
除了生图能力外,GPT-4o还更新到新版本GPT-4o-03-26,
提升了模型的指令遵循能力、编程能力、创造能力,解决了输出内容里过多表情符号的问题(这一点我觉得是负优化)。
在得分方面,LMSYS 在 LMSYS竞技场排名第2,超越 GPT4.5,价格是4.5的1/10。不得不说4.5真的是整个GPT系列里面最拉垮的。。。
这两天看到的都是吉卜力画风,
都快审美疲劳了,实际上 GPT-4o 还能生成更多更好玩的风格
评论区留下你的脑洞!
我来帮你实现。
@ 作者 / 卡尔 & 阿汤 @ 动手学AI知识库 / learnprompt.pro
最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论更多的内容正在不断填坑中……
热门跟贴