ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

网易专栏1周前发布 nxnqh
20 0 0

🤖 AI总结

主题

ComfyUI v0.20.1版本更新发布

摘要

ComfyUI v0.20.1发布,全面升级模型支持、音视频能力、API规范和执行稳定性,覆盖模型、视频、音频、前端等多个方面。

关键信息

  • 1 新增SUPIR、RIFE、FILM、SAM 3.1等模型支持
  • 2 强化视频音频处理能力,支持4K、alpha通道等
  • 3 API增加OpenAPI 3.1规范,执行引擎增加反循环验证

ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

ComfyUI v0.20.1 于 2026年4月28日发布,这次更新覆盖模型支持、视频处理、音频处理、API、执行引擎、前端、工作流模板、文档与伙伴节点等多个方面,整体升级非常密集。这个版本的核心关键词可以概括为:更强的模型支持、更完善的视频音频能力、更规范的 API、更稳定的执行逻辑,以及更丰富的节点生态

一、版本说明与整体特点

本次版本标注为Immutable release,也就是说:只有发布标题和发布说明可以修改。这意味着该版本的发布内容是相对稳定和固定的,适合直接作为生产环境升级参考。

从更新条目来看,v0.20.1 不是单点修复,而是一次覆盖面很广的综合升级,尤其集中在以下几个方向:

• 新增多种模型支持

  • • 音频与视频相关能力增强

  • • API 与内部接口更规范

  • • 工作流模板持续更新

  • • 前端包持续迭代

  • • 执行器稳定性和异常机制优化

  • • 伙伴节点持续扩展

    二、模型能力新增与增强 1. SUPIR 模型支持

    本版本加入了SUPIR model support。这项更新意味着 ComfyUI 在模型生态上的覆盖进一步扩大,为相关图像处理场景带来新的支持能力。

    2. Ernie 推理优化

    本次更新对Ernie inference做了一些优化,使其推理速度更快一些。虽然描述中使用的是“a bit faster”,但这类优化通常意味着推理链路中有一定效率提升,对实际使用体验会产生积极影响。

    3. LTX 音频 VAE 更原生化

    更新中提到Make the ltx audio vae more native,说明 LTX 音频 VAE 的处理方式更加贴近原生支持逻辑,这有助于提升音频相关节点的统一性和兼容性。

    4. 支持独立的 LTXV 音频 VAE

    本次新增了Support standalone LTXV audio VAEs,意味着 LTXV 音频 VAE 不再完全依赖既有绑定方式,而是可以作为独立对象进行支持。这对于音频处理工作流的灵活性有直接帮助。

    5. RIFE 与 FILM 帧插值模型支持

    这次版本加入了RIFE and FILM frame interpolation model support,属于非常实用的能力扩展。帧插值模型支持意味着视频相关工作流在帧间补偿、平滑处理方面可以获得更多模型选择。

    6. SAM 3.1 支持

    版本新增了SAM (segment anything) 3.1 support。这表示分割能力进一步更新,适用于更广泛的图像分割相关流程。

    7. 启用 SD2 real human 支持

    伙伴节点中新增了SD2 real human support,为相关节点使用场景补充了新的模型能力。

    8. HappyHorse 模型

    伙伴节点中还新增了HappyHorse model,继续扩展可用模型范围。

    三、视频相关能力强化 1. ByteDance 2 节点支持自动下采样

    伙伴节点新增了optional auto-downscaling of videos,用于 ByteDance 2 节点。这个功能允许视频在处理时根据需要自动进行降采样,提升处理灵活性。

    2. Veo 模型支持 4K 分辨率

    伙伴节点中增加了4K resolution for Veo models,并且还加入了Veo 3 Lite model。这说明 Veo 相关工作流在分辨率和模型版本上都更丰富了。

    3. 修复 Veo 3.0 模型的 4K 分辨率拒绝问题

    同时也修复了一个与 Veo 有关的问题:reject 4K resolution for veo-3.0 models。也就是说,针对 veo-3.0 模型,系统会拒绝不适配的 4K 分辨率设置,避免错误使用。

    4. Kling 节点增加 4K 分辨率

    伙伴节点中还为Kling nodes增加了 4K 分辨率支持,使视频生成相关节点能力更进一步。

    5. 更好地加载高位深视频

    本次更新修复了Properly load higher bit depth videos,让高位深视频的加载更可靠。

    6. 支持视频 alpha 通道

    版本还新增了Support loading the alpha channel of videos。这意味着视频透明通道可以被加载,这在更复杂的视频合成和编辑场景中非常有用。

    四、音频相关能力增强 1. LTX 音频 VAE 更原生

    前面已经提到,这次更新让 LTX 音频 VAE 更加原生化,这属于音频支持基础设施上的增强。

    2. 支持独立 LTXV 音频 VAE

    这一条与上面配套,说明音频 VAE 的使用更灵活,更适合独立部署和组合式工作流。

    3. 修复 LTXV Reference Audio 节点

    本次更新还修复了LTXV Reference Audio node,提升相关音频节点的可用性。

    五、前端与界面包更新 1. comfyui-frontend-package 多次升级

    本次版本中,前端包经历了多次更新,包括:

    • 升级到1.42.12

  • • 升级到1.42.14

  • • 升级到1.42.15

    这说明前端层面在持续迭代,涉及的可能是交互体验、组件修复、性能优化和兼容性调整等。

    2. 预览任意节点时打印更多 tensor 值

    更新中加入了Print more tensor values in the preview any node。这意味着在预览节点时可以看到更多 tensor 值,有助于调试和分析数据流。

    3. 修复模糊/锐化 shader 的 texel size 计算

    本次修复了 shader 中的一个实现细节:use textureSize instead of u_resolution for texel size in blur/sharpen shaders。这类修复通常会影响视觉效果计算的准确性。

    六、API、内部接口与规范性增强 1. 为内部 files endpoint 增加目录类型标注

    本次修复了append directory type annotation to internal files endpoint。这说明内部文件接口在返回目录类型时更加规范,有助于减少接口歧义。

    2. 添加 OpenAPI 3.1 规范

    版本新增了OpenAPI 3.1 specification for ComfyUI API。这是非常重要的接口升级,意味着 API 文档和规范化能力更强,更利于第三方接入和自动生成接口说明。

    3. 允许在 comfy app files 中记录日志

    本次更新还加入了Allow logging in comfy app files。这对于应用文件相关的调试、追踪和问题定位有帮助。

    4. 提高无效版本格式的日志级别

    更新中提到Update logging level for invalid version format,说明系统在处理非法版本格式时,日志提示更合理。

    七、执行引擎与稳定性改进 1. InterruptProcessingException 继承自 BaseException

    本次更新将InterruptProcessingException改为继承自BaseException。这通常意味着异常处理逻辑更符合底层中断类异常的特性,也可能减少一些被普通异常处理捕获的情况。

    2. 加入反循环验证

    执行层新增了anti-cycle validation。这项能力对工作流执行非常关键,可以更早发现循环依赖问题,提升执行安全性。

    3. 对 stray weights 强制类型转换

    本次修复了force cast stray weights on comfy layers。这类调整通常与模型权重加载和兼容性有关,能减少异常权重导致的问题。

    4. Stable_Zero123 cc_projection 权重赋值修复

    更新中修复了use Parameter assignment for Stable_Zero123 cc_projection weights,属于模型权重赋值方式的修正。

    5. EmptySD3LatentImage 节点使用中间 dtype

    本次还更新了Make EmptySD3LatentImage node use intermediate dtype,说明该节点在中间数据类型使用上更合理,能改善处理稳定性。

    八、嵌入文档、模板与蓝图更新 1. 工作流模板持续升级

    本次版本对工作流模板进行了多次更新,依次为:

    • v0.9.59

  • • v0.9.61

  • • v0.9.62

  • • v0.9.63

    这说明模板内容在持续演进,便于用户使用更接近最新版本的流程结构。

    2. 新增 ComfyUI blueprints 并修复 subgraph 命名

    更新中加入了new ComfyUI blueprints,同时修复了subgraph naming。这类改动有助于让工作流结构更清晰,蓝图使用更友好。

    3. 更新嵌入文档到 v0.4.4

    本次版本还将embedded docs更新到了v0.4.4。这意味着内置文档内容同步到了新的版本,方便用户在使用 ComfyUI 时直接参考更完整、更及时的说明信息。对于需要快速查阅节点、流程、接口或功能说明的用户来说,这类更新能明显提升使用便利性。

    九、伙伴节点扩展内容

    本次更新里,伙伴节点的变化非常多,而且覆盖视频、图像、模型、价格展示等多个方向,是 v0.20.1 的一大看点。

    1. ByteDance 2 节点支持自动下采样

    如前所述,伙伴节点增加了视频自动下采样功能,提升视频处理灵活性。

    2. Veo 模型增加 4K 分辨率与 Veo 3 Lite 模型

    伙伴节点继续为 Veo 系列增强支持,使其更适配不同分辨率与模型版本的需求。

    3. Kling 节点增加 4K 分辨率

    这同样是视频生成场景的重要增强。

    4. GPTImage 增加版本选项

    本次更新中还为gpt-image-2增加了version option。这意味着 GPTImage 相关节点在版本选择上更灵活,适配不同使用需要。

    5. GPTImage 修复价格徽标并添加新分辨率

    伙伴节点还修复了price badges,并且增加了新的分辨率选项,增强了展示与可选参数能力。

    6. Sora 节点增加即将弃用提示

    更新中为Sora nodes添加了upcoming-deprecation notice。这类提示能让用户提前知晓相关节点的后续变化安排,便于调整工作流。

    十、其他细节修复与调整 1. Range type

    本次更新中还包含了一个range type的调整。这类类型定义修正往往属于底层类型系统或参数处理上的改进,虽然表述简短,但对整体一致性有帮助。

    2. 修复 preview any node 中 tensor 值显示

    与前端预览相关的调试输出增强,能更好地帮助用户观察节点数据状态。

    3. 更新日志级别与版本格式校验

    对无效版本格式的日志级别进行了调整,说明系统在处理版本相关输入时更规范。

    4. 其他节点与权重处理修正

    包括:

    • Stable_Zero123 的 cc_projection 权重赋值修复

  • • stray weights 的强制类型转换

  • • EmptySD3LatentImage 的中间 dtype 调整

  • • LTXV Reference Audio 的修复

    这些内容都属于提高稳定性和可用性的基础性更新。

    十一、版本要点总结

    如果要用一句话概括 ComfyUI v0.20.1,那么它不是单纯的小修小补,而是一次围绕模型支持、音视频能力、API 规范、执行稳定性和生态扩展的集中强化版本

    这次更新的重点可以整理为:

    • 新增 SUPIR、RIFE、FILM、SAM 3.1 等模型支持

  • • 强化 Ernie 推理性能

  • • 音频 VAE 与 LTXV 音频链路更原生、更独立

  • • 视频处理能力明显增强,包括高位深、alpha 通道、4K、自动下采样等

  • • API 增加 OpenAPI 3.1 规范,接口更标准

  • • 执行引擎增加 anti-cycle validation,稳定性更强

  • • 前端包持续升级,预览与 shader 细节优化

  • • 工作流模板、蓝图、嵌入文档持续更新

  • • 伙伴节点新增多项模型与功能支持,并包含多个修复项

    十二、结语

    代码地址:github.com/Comfy-Org/ComfyUI

    ComfyUI v0.20.1 这次更新给人的直观感受就是:覆盖广、改动实、节奏快。从模型到视频、从音频到 API、从前端到执行层,再到工作流模板和伙伴节点,几乎每个关键模块都有涉及。对于日常使用 ComfyUI 的用户来说,这种版本更新意味着可用能力更丰富,稳定性更高,接口更规范,生态也更活跃。

    我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

    © 版权声明

    相关文章