加州大学 Hao AI Lab 正式发布视频生成 AI 模型 FastWan-QAD,通过量化感知蒸馏QAD技术,在 GeForce RTX 5090 显卡上只需要 1.78 秒就能生成一段 5 秒时长的 480p 视频。比基础模型 Wan2.1-T2V-1.3B 的 170 秒,速度提升了 95 倍。
量化感知蒸馏QAD技术,主要采用量化技术,通过降低精度减少显存使用和运算时间,但最大的问题就是质量会降低,而FastWan-QAD先采用量化感知微调QAT,然后再执行感知的 DMD 蒸馏,同时采样步数压缩3步,在训练过程中让模型适应低精度带来的误差,从而保障了质量。
FastWan-QAD 采用Apache License 2.0 协议开源:
打开网易新闻 查看精彩图片
三个版本:
- • FastWan-QAD-1.3B:采用NVFP4 低精度,SageAttention3 FP4后端
- • FastWan-QAD-1.3B-SA2:采用NVFP4 低精度,SageAttention2++ 后端,画质更高,推理时间稍长
- • FastWan-QAD-FP8-1.3B:兼容不支持FP4 Tensor Core 的就显卡,SageAttention2++后端和FP8 线性层
和其它模型相比,生成速度如何呢,比较了四款模型:
打开网易新闻 查看精彩图片
整体视频质量上如下图,四款模型都在单张 RTX 5090 上生成 5 秒 480p 视频:
打开网易新闻 查看精彩图片
至少从上图上看,FastWan-QAD两个模型视频质量还不错。
本地视频生成模型又多了一个选择,视频生成模型最核心的目标实际上是成本和生成速度。
热门跟贴