打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

一、ComfyUI v0.21.0 正式发布

ComfyUI v0.21.0 已于 2026 年 5 月 11 日发布。本次版本更新量非常大,涵盖了视频处理、图像加载、显存优化、模型支持、节点修复、API 规范、工作流模板、云端运行能力、合作节点、前端包升级等多个方向。

整体来看,这一版本的关键词可以概括为:

  • 视频能力增强

  • PyAV 图像/视频加载全面切换

  • 显存与内存优化

  • 节点稳定性与兼容性修复

  • 模型支持持续扩展

  • 云端与 API 能力补强

  • 工作流模板与前端持续演进

对于正在使用 ComfyUI 的用户来说,这个版本不仅是一次功能更新,更是一次底层能力的系统升级。尤其是视频相关节点、图片加载方式、显存管理和 API 结构方面,变化非常明显。

二、核心更新一览

本次更新内容非常丰富,以下按主题进行整理。

1. 视频与音频处理增强

本版本最值得关注的变化之一,是在视频 loader 节点中实现了音频与视频同时读取。这意味着在处理多媒体输入时,ComfyUI 的能力更完整,不再只局限于视频帧本身。

同时,围绕 PyAV 的加载方式,官方还做了多项增强:

  • • 处理元数据旋转信息

  • • 支持 tRNS PNG

  • • 使用 PyAV 加载图片而不是 Pillow

  • • 降低 8 位格式的峰值内存占用

  • • 改进 JPEG 其他格式的加载内存表现

  • • 修复与音频 latents 相关的解码问题

  • • 让视频 tiny VAE 的峰值显存更低、解码更快

  • • 增强对时间维度和视频生成流程的支持

这些变化说明 ComfyUI 正在持续向更高效、更统一的多媒体处理体系靠拢。

2. 显存、内存和性能优化

动态显存与缓存相关优化也是本版本的重要内容。

更新中包括:

  • • dynamicVRAM + --cache-ram 2

  • • AMD portable 增加动态显存启动脚本

  • • 优化动态显存准备日志

  • • 预取逻辑在无 offload 情况下的保护

  • • 为 frame interpolation 修正内存估算

  • • 为 LTX 相关流程实施 block prefetch、Lora Async load 等速度优化

  • • 让某些模型权重在多次计算时更好地处理

  • • 修复固有的 device mismatch 问题

  • • 修复多设备、多通道、不同图像格式下的内存行为

这些改进对于显存较紧张、使用大模型、视频模型或复杂工作流的用户非常关键。

3. 模型支持继续扩展

v0.21.0 对模型支持进行了大量扩展,包括但不限于:

  • • Comfy-AIMDO v0.3.0

  • • Cogvideox

  • • Gemma4 文本生成支持

  • • Auto-regressive video generation

  • • Void model 的进一步支持

  • • 支持 BiRefNet 背景去除模型

  • • 支持 Wan-Dancer

  • • 支持 LTX-2.x 生成的音频 latents

  • • 支持 Causal forcing model 的 I2V

  • • 支持 More model families and partner nodes integrations

与此同时,还新增了一系列合作节点模型,例如:

  • • GPTImage2 自定义分辨率

  • • ByteDance 虚拟人像库

  • • Topaz Astra 2

  • • Luma UNI-1

  • • Gpt 5.5 和 5.5-pro

  • • grok-imagine-image-quality

  • • NanoBanana2

  • • Tripo3D 3.1

  • • Kling V3 motion control 价格徽标修复

  • • 针对 SD2 的 adaptive aspect ratio

  • • 以及其他合作节点模型扩展

这表明 ComfyUI 在“图像生成 + 视频生成 + 文本模型 + 3D 模型 + 商业 API 模型”上都在持续扩张。

4. 节点修复与兼容性增强

本版本对很多节点做了修复,涉及图像处理、掩码处理、批量处理、裁剪、颜色转换、文本节点、图层、tile 操作等。

比如:

  • • SolidMask 和 MaskComposite 在 gpu-only 模式下设备不一致的问题

  • • ImageBlend 和 ImageCompositeMasked 对不同通道数图像的处理问题

  • • JoinImageWithAlpha 的 batch broadcasting

  • • LoadImageMask 重构为复用 LoadImage 代码

  • • ColorTransfer 节点的参考图像要求修复

  • • SplitImageToTileList 与 ImageMergeTileList 的垂直 stride 最小值修复

  • • Content-Disposition 头处理

  • • get_file_info 返回毫秒级时间戳

  • • NodeReplaceManager 注册幂等性

  • • mask 不在同一设备时的错误

  • • LTXVAddGuide 中 guide image 的 center-crop 行为

  • • LTXVImgToVideoInplace 不再错误修改输入 latents 并丢失 noise_mask

这些修复内容虽然分散,但对实际使用体验提升非常明显。

三、按模块详细解读更新内容

下面逐项展开说明,方便你在文章中体现“全面、专业、信息密度高”的特点。

1)视频 loader 节点同时读取音频和视频

本次更新中,视频 loader 节点增加了同时读取音频和视频的能力。
这意味着在处理视频素材时,音画信息可以被更完整地保留和利用,对后续多模态工作流有直接帮助。

2)处理未初始化 meta-tensors 的问题

修复了模型中未初始化 meta-tensors 的处理问题,这也修复了某些 CPU TE 崩溃情况。
这类底层修复虽然不显眼,但对于稳定性非常重要。

3)保存 3D 模型节点的文件名前缀调整

保存 3D 模型的节点,其文件名前缀改为3d/ComfyUI
这一变化有助于统一管理导出资源。

4)SolidMask 和 MaskComposite 的设备不一致修复

--gpu-only场景下,SolidMask 和 MaskComposite 可能存在设备不一致问题,本次已修复。
对于严格显存或单 GPU 运行场景,这类问题很关键。

5)处理 metadata rotation

PyAV 代码中增加了对元数据旋转信息的处理。
这对图像和视频的方向识别非常重要,尤其是来自不同设备或平台的媒体文件。

6)PyAV 加载代码支持 tRNS PNG

tRNS PNG 是一种带透明度信息的 PNG 形式,本次更新让加载代码可以正确处理。
这进一步提升了图片兼容性。

7)改用 PyAV 加载图片

官方将图片加载逻辑从 Pillow 切换为 PyAV。
这是一个非常重要的底层变化,意味着图像、视频和其他多媒体资源的处理逻辑更加统一。

8)dynamicVRAM 与 --cache-ram 2

显存管理逻辑进一步增强,特别是在动态显存配合缓存 RAM 的场景下进行了适配。
这对低显存设备和复杂工作流特别有帮助。

9)减少视频 tiny VAE 的峰值显存和解码时间

视频 tiny VAE 的峰值显存更低,解码速度更快。
对视频生成和视频解码工作流来说,这是直接可感知的优化。

10)Cogvideox 支持

新增了 Cogvideox 相关支持,进一步扩展视频生成能力。

11)Flux2 latents 高质量预览支持

Flux2 latents 增加了高质量预览支持。
这对于查看中间结果、调试流程非常有价值。

12)8 bit 格式低峰值内存优化

在 PyAV 的支持下,8 位格式的加载峰值内存得到了降低。
对于大批量图片和视频输入来说,能够显著缓解内存压力。

13)SQLAlchemy 版本格式修正

修复了 requirements.txt 中 SQLAlchemy 版本格式问题。
属于依赖管理层面的修正。

14)GPTImage2 支持自定义分辨率

合作节点中,GPTImage2 现在支持自定义分辨率,同时还能始终显示自定义宽高。
这使得生成参数更直观。

15)ByteDance 虚拟人像库

增加了适用于普通图像的虚拟人像库能力。
属于合作节点扩展。

16)JPEG 其他格式低内存加载

进一步优化 JPEG 其他格式的加载方式,减少内存占用。

17)OneTrainer ERNIE LoRA 支持

新增 OneTrainer 对 ERNIE LoRA 的支持。
对训练生态是补充。

18)工作流模板升级

工作流模板持续更新到多个版本,包括:

  • • v0.9.65

  • • v0.9.66

  • • v0.9.68

  • • v0.9.69

  • • v0.9.72

  • • v0.9.73

这说明模板体系在持续演进,用户可以直接受益于新模板结构。

19)代码所有者更新

更新了多个代码所有者配置。
属于维护性内容。

20)Moonvalley API 节点移除

API 节点中移除了 Moonvalley 相关内容。
属于接口整理。

21)伙伴 API 节点超时默认值提升

合作节点 API 任务默认超时时间提升,减少超时失败概率。

22)移除 IPEX 支持

Intel Extension for Pytorch 支持被移除。
这对相关环境的用户是重要变更。

23)SDPose resize 修复

SDPose 的 resize 逻辑修复,增强图像姿态节点稳定性。

24)README 与文档更新

README 做了多项更新,包括:

  • • 更新说明

  • • 更新截图

  • • 列出全部 portable 下载项

  • • 更新 frontend 安装警告文案

  • • 文档中说明核心稳定版本发布频率约为两周一次

这些改动有助于新用户快速理解项目现状。

25)加载图像节点清理与重构

load image节点进行了清理;LoadImageMask也重构为复用LoadImage代码。
这类改动能减少重复逻辑并提升维护性。

26)PrimitiveInt 默认控件行为修正

control_after_generatewidget 默认改为 fixed。
属于交互体验优化。

27)ColorTransfer 节点修复

ColorTransfer 节点的ref_image现在必须提供。
这让节点行为更明确。

28)端口占用错误处理修复

启动服务时如果端口被占用,现可更优雅地处理。
这对开发者非常实用。

29)JoinImageWithAlpha 批处理广播支持

该节点加入 batch broadcasting,提升批处理兼容性。

30)triton comfy kitchen 命令行支持

支持通过 CLI 参数启用 triton comfy kitchen。

31)控制网加载顺序确定化

control-net 的加载顺序变得确定。
这有助于结果可复现。

32)同一权重多次计算处理

修复了相同权重多次计算时的处理问题。

33)显示名称与分类调整

多个节点的 display names 和 categories 被更新。
这类调整通常影响前端展示和分类组织。

34)OpenAPI 与 spec 扩展

规范层面增加了很多内容:

  • • DeviceStats.index 与 NodeInfo.essentials_category 改为可空

  • • PromptRequest 增加 workflow_id / workflow_version_id

  • • 伙伴节点 API 调用增加 Comfy-Env 头

  • • cloud-runtime 的前端操作加入规范

  • • cloud-runtime 实验节点 schema endpoints 加入规范

  • • cloud-specific 字段在 OSS openapi.yaml 中设为 nullable

  • • MultiCombo multi_select 序列化修正

  • • Content-Disposition 相关问题处理

  • • 为 openapi.yaml 增加 Spectral lint CI gate

这些内容说明 API 规范化正在加强。

35)核心版本节奏说明

文档明确指出核心稳定版本发布频率约为两周一次。
这对使用者和集成者来说,是一个重要的信息。

36)自动回归视频生成支持

新增 Auto-regressive video generation 支持,扩展视频生成路线。

37)tile 相关节点 stride 修复

SplitImageToTileList 和 ImageMergeTileList 的垂直 stride 最小值修复,保证切块处理正确。

38)Luma UNI-1、Gpt 5.5、Gpt 5.5-pro、grok-imagine-image-quality 等合作模型

合作节点继续扩展到更多模型和能力。

39)背景去除模型支持

新增 BiRefNet 背景移除模型支持。

40)LTXV 系列修复

包括:

  • • guide image 的居中裁剪

  • • 不再错误修改输入 latents

  • • 不再丢失 noise_mask

这些修复对视频和 latent 流程很关键。

41)mask 设备一致性修复

解决 mask 不在同一设备上的问题。

42)Blueprint 子图描述字段

增加了 blueprint subgraphs 的 description 字段。
增强蓝图可读性。

43)Wan-Dancer 支持

新增 Wan-Dancer 支持。

44)LatentCutToBatch 替换

有处流程改用了LatentCutToBatch

45)Math Expression 节点支持布尔值

数学表达式节点增加 Boolean 支持。

46)新蓝图加入

加入新的 blueprints。
属于工作流资源补充。

四、这次更新适合谁关注

如果你是以下几类用户,这次更新都值得重点看:

  • 视频生成用户:音频+视频同步读取、Auto-regressive video generation、Cogvideox、LTX、WAN 相关变化都很重要。

  • 低显存用户:dynamicVRAM、cache-ram、tiny VAE 优化、8bit 内存优化都很有价值。

  • 工作流开发者:API spec、节点分类、display name、蓝图字段、模板升级等都影响实际开发。

  • 合作节点使用者:GPTImage2、Topaz Astra 2、Luma UNI-1、Tripo3D 3.1、Gpt 5.5 系列等更新频繁。

  • 图像与掩码处理用户:图像通道处理、alpha 合并、mask 修复、LoadImage 重构会直接影响结果。

  • 部署与运维人员:端口占用处理、前端安装提示、portable 下载说明、环境头、超时设置等都很重要。

五、总结

代码地址:github.com/Comfy-Org/ComfyUI

ComfyUI v0.21.0 是一个非常典型的“大版本连续演进”更新。它没有只停留在表面功能堆叠,而是从底层加载方式、显存管理、视频处理、API 规范、工作流模板、节点兼容性到合作生态都进行了广泛调整。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。