AI出图进阶篇 04

AI画人终极难题手部修复与面部一致性

画脸容易画手难,多人场景更头疼——终极解决方案

系列四 · AI出图进阶控制 · 第4篇

用AI画图到现在,你一定遇到过这些崩溃瞬间:

脸画得很好看,低头一看——六根手指。

一个人画得没问题,加第二个人——两张脸长得一模一样。

姿势不对想修一下,一修——整张脸都变了,不认识是谁了。

AI画人是整个AI出图领域最难啃的骨头。不是模型不行,是人体结构太复杂——手部有27块骨头、面部有43块肌肉,AI在低分辨率潜空间里根本搞不清这些东西的精确位置。

但这篇讲完,你就能解决90%以上的画人问题。

打开网易新闻 查看精彩图片

AI画人翻车三件套:多指、串脸、表情崩——本篇逐个解决

为什么AI画不好手

先理解原因,才能对症下药。

AI画图的训练数据里,手的像素面积通常只占整张图的1%~3%。一张512x512的图,一只手可能只有30x30像素的区域。AI在这个分辨率下根本学不到手指的精确结构。

脸就不一样了——脸通常占画面的15%~30%,像素足够多,AI学得足够好。所以你会发现AI画脸一般还行,画手必崩

多人场景的问题更复杂:AI看到两个人的脸,会在潜空间里"平均"它们的特征,导致两个人长得像双胞胎。这叫特征串扰

知道原因了,解决思路也就清楚了:手要用专门工具修,脸要用控制手段锁定,多人要分区处理

手部修复:三层防线

画好手不是一步到位的事,需要三层防线层层递进。

第一层:提示词预防

在提示词里明确写手部状态,给AI正确的引导。
写清楚手在做什么、手指怎么放、手心还是手背。
比如"detailed hands, five fingers, right hand resting on table, left hand holding cup"。
反向提示词加上"extra fingers, deformed hands, missing fingers, fused fingers, mutated hands"。
这一层能预防50%的手部问题,但复杂手势还是会崩。

第二层:ControlNet手部骨架

用OpenPose的Hand模型给AI提供精确的手部骨架参考。
流程是:找一张手部姿势正确的参考图,用OpenPose提取手部骨架,然后在生成时用这个骨架约束AI。
权重设0.6~0.8,太高手指会僵硬,太低骨架等于没给。
这一层能解决80%的复杂手势问题。

第三层:局部重绘修补

前两层都没搞定的手,用Inpainting单独修。
只涂抹手部区域,提示词写"perfect hands, five fingers, detailed"。
重绘幅度0.5~0.7,反复生成直到手部正确。
这是最后的兜底手段,几乎所有手部问题都能用这个方法修好。

打开网易新闻 查看精彩图片

从提示词预防到局部重绘修补,三层防线逐级递进

面部一致性:让同一个人出现在不同图里

做系列图、角色IP、故事绘本的时候,你需要同一个人出现在不同场景里,脸还不能变。这是AI画人第二大难题。

目前有四种主流方案,按效果从强到弱排列:

方案一:IP-Adapter FaceID— 最推荐

把一张人脸照片喂给IP-Adapter的FaceID模型,它会提取面部特征嵌入到生成过程中。

权重0.6~0.8,能保持70%~85%的面部相似度。

优点是不需要训练,即插即用。缺点是侧脸和夸张表情时一致性会下降。

提示词写法:a person with [face reference], wearing business suit, standing in office, professional lighting, 8k

方案二:LoRA角色训练— 最稳定

用同一个人的15~30张不同角度照片训练一个LoRA模型。

训练完成后,在提示词里调用这个LoRA,AI就能在任何场景里画出这个人。

一致性可达90%以上,表情、角度、光照变化都不怕。

缺点是需要训练,门槛稍高。下篇LoRA专题会详细讲流程。

方案三:Roop / Face Swap换脸— 最快

先生成一张构图正确但脸不对的图,然后用Roop插件直接把目标脸换上去。

速度最快,操作最简单,但表情和光照的融合效果不如前两种。

适合快速出图不追求完美融合的场景。

方案四:After Detailer面部精修— 兜底

ADetailer是Stable Diffusion的一个扩展插件,专门用于自动检测和重绘面部。

生成图后它会自动找到脸部区域,用你提供的提示词重新画一遍脸。

配合IP-Adapter使用效果最好——先用IP-Adapter锁定特征,再用ADetailer精修细节。

打开网易新闻 查看精彩图片

四种面部一致性方案:从即插即用到训练定制,按需选择

多人场景:分区治理防止串脸

画两个人的时候,AI会把他们的脸"平均"掉,导致两张脸长得一样。画三个人的时候更夸张,可能三张脸都分不清谁是谁。

解决方法是分区治理——给每个人单独的面部控制。

1. 用OpenPose锁定每个人的姿态

先画好两个人的姿势骨架,确保位置不重叠、姿态正确。
这一步只管身体姿势,不管脸。

2. 用Regional Prompter分区提示

Regional Prompter插件可以把画面分成几个区域,每个区域用不同的提示词。
比如左半边写"a man with beard, short black hair",右半边写"a woman with long blonde hair, red lips"。
这样AI就不会把两个人的特征混在一起。

3. 分别用IP-Adapter锁定每张脸

如果需要特定的人脸,给左边的人用一张参考脸,右边的人用另一张参考脸。
IP-Adapter支持多图输入,分别设置权重和区域。

4. 用ADetailer分区精修

最后用ADetailer自动检测每张脸,分别重绘。
如果是两个不同的人,在ADetailer里设置不同的提示词,确保每张脸的修整方向不同。

实战案例:品牌双人代言图

假设你要给葡萄酒品牌做一张双人代言图——一个男性品酒师和一个女性侍酒师,站在酒架前。两个人必须是不同的面孔,各有各的特征。

案例背景

葡萄酒品牌双人代言场景图

构图

男性在左,穿深色西装,手持酒杯;女性在右,穿黑色围裙,手持酒瓶;背景是木质酒架

提示词

two people in wine cellar, man on left wearing dark suit holding wine glass, woman on right wearing black apron holding wine bottle, wooden wine racks background, warm ambient lighting, professional photography, 8k

分区提示词(Regional Prompter)

左侧区域:man, short black hair, beard, sharp jawline, brown eyes / 右侧区域:woman, long brown hair, no glasses, red lips, green eyes

参数设置

ControlNet OpenPose(双人骨架)| Regional Prompter(左右分区)| ADetailer(面部精修)| 采样步数30 | CFG 7.5

反向提示词

extra fingers, deformed hands, mutated hands, same face, identical faces, cloned face, blurry, low quality

结果

两个人面部特征明显不同——男性方脸胡须短发,女性圆脸红唇长发。手部各持酒杯和酒瓶,手指数量正确。背景酒架清晰,光线自然。整个流程从生成到精修大约15分钟。

打开网易新闻 查看精彩图片

分区治理+多层控制:两个人各有面孔,手部正确,构图自然

五个画人必踩的坑

1. 提示词不写手部状态— 只写"a person standing",AI自由发挥手部,结果必崩。必须明确写手在做什么,哪怕只是"hands relaxed at sides"也比不写强十倍。

2. 修手用全局重绘— 手崩了直接重新生成整张图,结果手好了脸变了。正确做法是只对手部区域做Inpainting局部重绘,其他区域完全不动。

3. IP-Adapter权重拉到1.0— 权重拉满会导致面部像贴图,光影不自然,表情僵硬。0.6~0.8是甜区,既保持特征又留出AI的光影创作空间。

4. 多人不分区直接画— 两个人的提示词混在一起,AI分不清谁是谁。必须用Regional Prompter分区,或者至少在提示词里用"on left""on right"明确位置。

5. 忘了用ADetailer— 觉得生成出来脸还行就不管了,放大一看眼睛不对称、嘴歪了。ADetailer应该是画人的标配最后一步,不管脸看起来好不好都要过一遍。

画人速查卡片

手部修复

提示词预防 + OpenPose骨架 + Inpainting修补,三层防线逐级递进

面部一致

IP-Adapter即插即用,LoRA最稳定,Roop最快,ADetailer兜底

多人防串

Regional Prompter分区提示 + 分别锁定面部特征 + ADetailer分区精修

画人标配

ADetailer永远作为最后一步,不管脸看起来好不好都要过一遍精修

AI画人的核心就一句话

手要三层修,脸要工具锁,多人要分区
ADetailer永远是最后一步
提示词写清楚手在做什么,比任何修复工具都管用