ComfyUI v0.18.0 发布：显存与内存极限优化、VAE架构全面进化、API节点与前端生态深度升级

网易专栏2个月前发布 nxnqh

66 0 0

发布时间：2026-03-23 00:09:41

#AI | #ComfyUI

来源：网易专栏作者：moonfdd
🔗 查看原文

🤖 AI总结

主题

关于AI图像生成工具ComfyUI v0.18.0版本的更新内容介绍。

摘要

ComfyUI v0.18.0是一次深度工程级更新,核心在于优化显存与内存管理、统一数据类型,并增强推理与API能力,旨在提升稳定性和性能。

关键信息

1 ComfyUI v0.18.0版本以稳定性与性能为核心。
2 重点优化了VAE显存管理、统一了数据类型体系。
3 增强了推理、训练能力并扩展了API节点功能。

ComfyUI v0.18.0 发布：显存与内存极限优化、VAE架构全面进化、API节点与前端生态深度升级

一、版本概览：一次“以稳定性与性能为核心”的里程碑更新

ComfyUI v0.18.0 于2026 年 3 月 21 日正式发布，这是一个不可变版本（仅允许修改发布标题与说明），也是目前为止变更密度最高、底层改动最深的一次版本更新之一。

本次更新共计：

•53 次提交

•79 个文件变更

•22 位贡献者

• 覆盖核心推理、VAE、显存管理、训练、API 节点、前端、工作流模板、CLI 参数、跨平台支持

整体方向可以总结为四个关键词：

更省显存 · 更稳内存 · 更强扩展 · 更一致的数据类型体系

二、显存与内存管理：v0.18.0 的绝对核心 1. VAE 内存优化达到新高度（LTX / WAN / 视频 VAE 全覆盖）

这是本次更新中最重要、也是改动最多的部分。

主要变化包括：

•LTX VAE 解码显存多轮削减

• 解码阶段峰值内存显著下降

• 中间结果在intermediate_device上累积

• 解码流程改为更细粒度的 chunk 处理

•LTX VAE 编码器新增分块机制

• 编码阶段支持 chunked encoder

• CPU IO 分块加载，显著降低显存压力

•WAN VAE 显存优化

• 避免大分辨率下的 OOM

• Tiler 场景更安全

•视频 VAE 修复显存泄漏

• 修复 tiler fallback 场景下的 VRAM leak

•像素空间 VAE 潜在问题修复

•VAE 输出支持原地处理

• 有效降低峰值 RAM 消耗

•tiled decode 峰值内存进一步降低

✅结果：
即使是中低显存显卡，也能稳定运行高分辨率图像、复杂视频工作流。

2. 中间数据 dtype / device 体系全面统一

ComfyUI 在 v0.18.0 中系统性推进了一个重要理念：

中间值必须严格跟随 intermediate dtype 与 device

涉及节点与模块：

• EmptyLatentImage

• EmptyImage

• 多个推理中间变量

• VAE 中间解码与编码结果

新增参数：

•--fp16-intermediates

• 强制中间计算使用 FP16

• 显著降低显存占用

• 针对部分文本编码模型存在兼容性问题，已明确标注并修复相关回归

同时：

• 修复了 FP16 intermediates 在部分文本编码器中不生效的问题

• 明确区分权重 dtype 与中间计算 dtype

• Load Diffusion Model 节点中weight_dtype被标记为高级参数

3. 动态显存与内存安全机制增强

• 新增命令行参数：

•--enable-dynamic-vram

• 可强制开启动态显存机制

• pinned read 逻辑增加更多排除条件

• 修复极少数情况下的输出损坏问题

• 跳过程序退出时的模型 finalizer

• 避免退出阶段的异常与卡死

• atomic 写入 userdata

• 防止程序崩溃时的数据损坏

三、推理与训练能力升级 1. 多精度与新数据格式支持

• 新增MXFP8 支持

• Trainer 支持：

• FP4

• FP8

• FP16

• 原生 dtype 支持

• 量化线性层自动求导函数

✅ 对训练场景的意义：

• 更低显存占用

• 更灵活的混合精度训练

• 更适合大模型与实验性模型

2. Attention 与平台适配优化

• AMD gfx1150 启用 PyTorch Attention

• 针对特定模型禁用 SageAttention

• 避免推理异常

• Apple Silicon 文本编码器 GPU 运行尝试后回退

• 确保稳定性优先

四、API Nodes 与模型生态升级 1. API Nodes 功能扩展

• Tencent TextToModel / ImageToModel 节点修复

• Nano Banana 2 新增thought_image支持

• 新增 Quiver SVG 节点

• 本地 API 与云端规范对齐

• 模型弃用标记：

• seedream-3-0-t2i

• seedance-1-0-lite

2. Context Window 与条件处理能力增强

• 新增slice_cond

• 支持按模型调整上下文窗口条件尺寸

• inline context window 导入结构优化

五、前端与工作流生态更新 1. 前端版本持续迭代

• comfyui-frontend-package 升级至：

• 1.41.19

• 1.41.20

• 1.41.21

• 使用 no-store cache header

• 防止前端资源缓存导致的版本不一致问题

2. 工作流与 UI 体验改进

• 工作流模板更新至 v0.9.26

• 节点新增 essentials_category

• 支持 Essentials 标签页

• 新手与高频节点更易发现

六、CLI、管理器与基础设施

• Manager 版本升级：

• 4.1b4

• 4.1b5

• 4.1b6

• comfy-aimdo 升级：

• 0.2.11

• 0.2.12

• Windows 平台 RAM 释放策略优化

• 推理速度提升

• 内存回收更及时

• CI 增加校验规则

• 阻止自动生成的 AI 协作标记进入主分支

七、稳定性修复与回滚说明

本次版本也包含多个关键回滚与问题修复：

• 回滚外部分布式缓存 API 的相关改动

• 修复多次回归问题

• 修复初始化变量缺失

• 删除无效的权重初始化代码

• 避免子类场景下错误触发延迟初始化

这些操作的核心目标只有一个：

确保 v0.18.0 在复杂真实工作流中的长期稳定运行

八、总结：为什么 v0.18.0 是“必须升级”的版本

代码地址：github.com/Comfy-Org/ComfyUI

如果你符合以下任一情况，v0.18.0 都是强烈推荐升级的版本：

• 显存 8G / 12G 甚至更低

• 使用 LTX / WAN / 视频 VAE

• 需要高分辨率或大批量推理

• 关注推理稳定性与内存安全

• 使用 API Nodes 或自动化部署

• 进行模型训练或混合精度实验

ComfyUI v0.18.0 并不是功能堆砌型更新，而是一次深度“工程级进化”。

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。欢迎关注“福大大架构师每日一题”，发消息可获得面试资料，让AI助力您的未来发展。

网易专栏 # AI # ComfyUI

文章版权归作者所有，未经允许请勿转载。

阿里云的「Agentic 时刻」

网易专栏 # AI # 阿里云

6天前

特斯拉FSD V14.3.3更新：Actually Smart Summon速度提升33%

网易专栏 # AI # 特斯拉

2周前

智能体如何在合适的时机退让：人机协调设计的新视角

网易专栏 # AI # 人机协调

3个月前

惠普推出AI笔记本HP IQ系统，本地大语言模型助力办公

网易专栏 # AI # HP IQ

2个月前

ComfyUI v0.18.0 发布：显存与内存极限优化、VAE架构全面进化、API节点与前端生态深度升级

🤖 AI总结

主题

摘要

关键信息

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力

黄仁勋发Token当工资！硅谷兴起刷量大赛，一人烧掉33个维基百科

相关文章

阿里云的「Agentic 时刻」

特斯拉FSD V14.3.3更新：Actually Smart Summon速度提升33%

智能体如何在合适的时机退让：人机协调设计的新视角

惠普推出AI笔记本HP IQ系统，本地大语言模型助力办公