简介
Wan2.2 是一套针对高质量视频生成(T2V/I2V/TI2V/S2V/Animate)的开源模型系列,采用 Mixture-of-Experts(MoE)与高压缩 VAE 设计,目标在保留生成质量的同时提升效率与可控性。
主要特性
- MoE 架构:通过专家分工提升模型容量且控制推理成本。
- 多模态支持:覆盖文本、图像与音频到视频的生成管线,并提供 Animate 人物动作替换模块。
- 丰富生态:提供模型权重、推理代码、ComfyUI 与 Diffusers 集成示例以及在线演示空间。
使用场景
- 影视/短视频内容生成与风格化创作。
- 研究与学术评测,用于对比视频生成模型与探索 MoE/压缩策略。
- 产品原型与交互式演示,通过 Hugging Face Space 或自托管服务快速验证效果。
技术特点
- 高压缩 VAE 与混合稀疏专家设计,兼顾渲染质量与算力需求。
- 提供多种推理模式(单卡、Multi-GPU、FSDP + DeepSpeed)与模型转换工具。
- Apache-2.0 许可、活跃维护与论文支撑(详见仓库与项目页面)。