上一篇我们搞定了会"记住"品牌的文案Agent。但社交媒体没图等于没发——而设计师月薪500到1500美元,DALL-E、Midjourney月费20到60美元还听不懂你的品牌,每张图风格都不一样。

解决方案:自建Stable Diffusion+LoRA。边际成本归零,风格高度统一。

打开网易新闻 查看精彩图片

为什么不用DALL-E或Midjourney?

Stable Diffusion把文字变成图,ComfyUI把它变成可自动化的API,LoRA把通用结果变成品牌内容。三步搭建:

第一步:ComfyUI开API模式

GitHub拉代码,装依赖,下载SDXL基础模型放checkpoints目录,启动参数加--api。三个核心端点:POST /api/prompt执行工作流,GET /api/history查结果,GET /api/view下载图片。

第二步:写真正有用的Prompt

不是"好看的技术图",是精确技术指令:质量标签+主体描述+风格指令+灯光设置+色板+构图+负面词。

Guayoyo Tech的实例:masterpiece, best quality, 8k开头,描述现代开发者多屏工位,极简桌面,台灯暖光,蓝青强调色(#1A73E8 #22D3EE),浅景深,1080x1080方图。负面词排除低分辨率、水印、模糊、人物、杂乱桌面。

技术/DevOps内容用等轴视图、蓝图美学、深色UI;商务内容用企业摄影、玻璃办公室、自然窗光;抽象概念用数字艺术、几何渐变。

第三步:LoRA——一致性秘诀

LoRA(低秩适配)是塞进Stable Diffusion的微型模型,教它你的Logo、视觉风格、色板

方案A:Civitai下载公开LoRA,免费。方案B:自己训练,约2美元GPU云成本,10到15张参考图即可。

Prompt里插入,权重0.8控制强度。训练自己的LoRA需要准备统一风格的参考图集,标注触发词,用Kohya_ss或AI-Toolkit在云端跑训练。

输出路径:ComfyUI生成→自动上传图床→Agent写入文案→定时发布。整套系统跑在自有基础设施,零边际成本,风格百年如一日。