打开网易新闻 查看精彩图片

做设计的团队找我定制指令,不是第一次了。这次来的是一个乙方设计团队,项目是酒类智慧物流园区的效果图改造,要把已有的工业园区老图,用图生图的方式升级成有科技感的宣传效果图,但客户要求很死:不能改色调,不能改建筑体量,不能出现玻璃幕墙和赛博霓虹。

他们自己试了好几版,出来的图,要么整栋楼变成玻璃盒子,要么灯带发光像夜总会,要么建筑比例直接跑偏,根本没法用。解法很简单,这类图生图项目,卡点不在模型,在指令结构。

我用四步骤给他交付了一套豆包文生图优化“科技感”的指令。

1. 先把"禁止项"写进去,比正向描述更关键

很多人写提示词的习惯是堆正向词:科技感、现代感、智慧园区,越堆越多。但文生图模型理解"科技感",默认往玻璃幕墙和霓虹灯靠,这是它的训练数据决定的,不是你想象的那种"克制的智慧"。

所以这套指令的第一步,不是写想要什么,而是先锁死不要什么:不要玻璃幕墙、不要赛博风、不要未来城市、不要整体调色、不要改动标识文字。反向提示词写得越精准,模型跑偏的空间就越小,这是很多设计师忽略的结构逻辑。

2. 科技感要"降维"表达,用真实设施替代风格词

"智慧园区"这类词太抽象,模型理解偏差大,出来的图很难稳定。换成具体的可落地设施描述,出图就扎实很多:道闸与识别设备、监控传感器、园区导视牌、车道地面引导标线、小型LED信息屏、低调线性灯带(白天几乎不可见)。

这些都是真实工业园区里存在的东西,模型见过,能准确还原,不会脑补成科幻场景。同时,指令里分级给出轻、中、强三档正向提示词,对应不同的重绘强度参数,设计师自己选介入深度,不是一刀切,也不用反复猜参数。

3. 校验口令和纠偏口令单独做,出图后才能真正用上

图生图最大的问题是"方向不稳",第一轮出图,往往要人工确认再微调。这套指令专门设计了校验步骤和纠偏口令,出图后逐条比对:色调有没有偏,有没有出现玻璃幕墙,建筑比例有没有跑,文字有没有乱码。

针对每一个常见跑偏方向,都有对应的修正口令,直接追加到提示词末尾就能用,不用重新写,也不用靠经验去猜。这套逻辑,把一次性出图变成了可复用的校验闭环,下次换项目,改参数区就行,主体结构不用动。

设计团队按照这套指令跑了两轮,交付的效果图科技感有了,建筑体量没动,色调没跑,客户直接通过。出图稳不稳,从来不是模型的问题,是指令结构够不够扎实。