阿里云万相2.1：开源视频生成模型的全面解析

一、模型简介阿里云万相2.1（Wan 2.1）是通义万相系列的最新多模态视频生成大模型，于2025年1月发布，同年2月25日全面开源。该模型支持文生视频（T2V）和图生视频（I2V），并首次实现中文与英文文本效果动态融合，适用于广告、教育、影视等多领域。核心亮点多模态能力：支持文本/图像输入生成480P及以上分辨率视频，且可生成动态字幕或特效。创新架构：采用超长上下文训练和参数共享机制，降低训练成本。开源免费：提供两种参数版本（14B、1.3B）的完整代码与权重。高性能表现：在Vbench评测中以86…