FastWan-QAD视频模型发布，1.78秒就能生成5秒视频

呼呼历史论

2026-07-04 07:17 ·辽宁

加州大学 Hao AI Lab 正式发布视频生成 AI 模型 FastWan-QAD，通过量化感知蒸馏QAD技术，在 GeForce RTX 5090 显卡上只需要 1.78 秒就能生成一段 5 秒时长的 480p 视频。比基础模型 Wan2.1-T2V-1.3B 的 170 秒，速度提升了 95 倍。

量化感知蒸馏QAD技术，主要采用量化技术，通过降低精度减少显存使用和运算时间，但最大的问题就是质量会降低，而FastWan-QAD先采用量化感知微调QAT，然后再执行感知的 DMD 蒸馏，同时采样步数压缩3步，在训练过程中让模型适应低精度带来的误差，从而保障了质量。

FastWan-QAD 采用Apache License 2.0 协议开源：

三个版本：

• FastWan-QAD-1.3B：采用NVFP4 低精度，SageAttention3 FP4后端
• FastWan-QAD-1.3B-SA2：采用NVFP4 低精度，SageAttention2++ 后端，画质更高，推理时间稍长
• FastWan-QAD-FP8-1.3B：兼容不支持FP4 Tensor Core 的就显卡，SageAttention2++后端和FP8 线性层

和其它模型相比，生成速度如何呢，比较了四款模型：

整体视频质量上如下图，四款模型都在单张 RTX 5090 上生成 5 秒 480p 视频：

至少从上图上看，FastWan-QAD两个模型视频质量还不错。

本地视频生成模型又多了一个选择，视频生成模型最核心的目标实际上是成本和生成速度。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴