高保真细节拉满！开源通用方法Leffa助力模特虚拟试穿与姿势转移|leffa|原理|模特|纹理|细节|虚拟试穿|视觉|高保真

生成可控人物图像的目标是根据参考图像生成一个人物图像，并能精确控制人物的外貌或姿势。然而，尽管之前的方法能够生成高质量的整体图像，但常常会扭曲参考图像中的细节纹理。这种扭曲的原因，认为是因为模型在关注参考图像时，没有充分关注到对应的区域。

为了改善这一点，Meta提出了一种名为“Leffa”（注意力流场学习）的方法，专门帮助模型在训练时引导目标查询准确关注到参考图像中的正确区域。Leffa在控制人物外观（虚拟试穿）和姿势（姿势转移）方面，表现出了当前最好的效果，显著减少了细节失真，并且保持了图像的高质量。此外，Leffa方法是通用的，可以应用于其他扩散模型，提升它们的表现。（链接在文章底部，可以在线体验）

01 技术原理

Leffa生成的图像质量很高，细节保留得非常好，纹理失真很少。（实际效果可以运行后放大查看，以获得更清晰的效果。）

Leffa训练流程概述：左侧是基于扩散的基础模型，右侧是加入Leffa损失后的模型。需要注意的是，在训练过程中，Isrc和Itgt其实是同一张图像。

以人物图像的外观控制（虚拟试穿）为例：Leffa能够生成高质量的图像，没有细节失真（请看彩条纹理部分）。
(a)输入人物和参考（服装）图像；(b)使用基于扩散的方法生成的图像及其注意力图（例如，IDM-VTON）；(c)手动修改扩散方法中的注意力图，使其聚焦于正确的区域后生成的图像；(d)使用Leffa生成的图像及其注意力图。

与其他方法的定性视觉效果比较：用于姿势转移的输入人物图像是通过Leffa方法在虚拟试穿中生成的。可视化结果表明，Leffa方法不仅生成了高质量的图像，还大大减少了细节失真。

02 实际效果

安装和运行Gradio非常简单：（也可以在线体验）

在线演示效果（左侧原始图像、中间参考图像、右侧生成结果）：

衣服、身体等局部细节放大（可以看到细节很好）：

https://github.com/franciszzj/Leffa
https://arxiv.org/pdf/2412.08486
https://huggingface.co/spaces/franciszzj/Leffa

欢迎交流～，带你学习AI，了解AI

高保真细节拉满！开源通用方法Leffa助力模特虚拟试穿与姿势转移

热搜

热门跟贴

热搜

热门跟贴

相关推荐

厂妹玩的实在花，偷偷查看舍友这部位，多少有点没边界感！

国外美女挑战“无遮挡”换装，镜头记录全过程，评委们坐不住了

“以前的你”VS“现在的你”，终于发现：“会穿衣”是变美的关键

成为美女的第一步 丢掉所有宽松T恤

原来衣服上的布料，是用机器切割的，画出图案一秒完成！

被软体老师硬控，这身段是水做的吧，这才是真正的水蛇腰！

日本专为女人设计的拉链，用手机就可以控制，这脑洞真是绝了！

美女穿的太凉快 36D若隐若现 小伙眼睛亮了

在绝对的实力面前，任何特效化妆都是徒劳，美女只差一副眼镜了

女生正确使用大数据，这操作都看傻了，想要什么都不用自己开口！

小姐姐测试拳头力量，梨球被冲击到卡住，穿高跟鞋的果然不好惹！

小姐姐的压迫感竟然也能这么强

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

ChatGPT拒绝谈论这个人，没人知道为什么

DIY计算器装ChatGPT操作系统！终极作弊神器，代码已开源

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

深度解说《谍影重重3》最后的通牒＋细节分析！

男子展示自己的绝技，看的是一愣一愣的，这是什么原理！

美队细节揭秘，从70年的短袖到致命弱点

字节AI版小李子一开口：黄风岭，八百里

成为美女的第一步丢掉所有宽松T恤

美女穿的太凉快 36D若隐若现小伙眼睛亮了