盘前机会前瞻|阿里宣布视频大模型万相2.1开源！这几家公司在文生视频和AI短视频领域已服务众多客户有望受益（附概念股）

2月25日，从知情人士处获悉，阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月，阿里旗下万相刚宣布推出2.1版本模型升级，视频生成、图像生成两大能力均获得提升。在视频生成方面，万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力，支持无限长1080P视频的高效编解码，首次实现了中文文字视频生成功能，登上VBench榜单第一。

【机会前瞻】

2月25日，阿里巴巴集团宣布将旗下文生视频模型“万相2.1”全面开源。作为全球首个支持中英双语、首个实现无限长1080P视频编解码的开源模型，万相2.1的开放不仅打破了专业视频创作的技术壁垒，更可能重构全球AIGC产业的竞争格局。

万相2.1采用最宽松的Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，全球开发者可在Github、HuggingFace和魔搭社区下载体验。其中1.3B版本仅需8.2GB显存就可以生成高质量视频，适用于二次模型开发和学术研究。

今年1月，阿里旗下万相刚宣布推出2.1版本模型升级，视频生成、图像生成两大能力均获得提升。在视频VAE方面，万相2.1设计了创新的视频编解码方案，通过将视频拆分成若干块并缓存中间特征的方式，代替直接对长视频的E2E编解码过程，实现显存使用与原始视频长度无关，支持无限长1080P视频的高效编解码。万相2.1在视频生成领域的权威评测集VBench上以总分84.7%的成绩登顶，在运动幅度、多对象生成、空间关系等16个评分维度中的多个关键能力上拿下最高分。

万相团队的实验结果显示，在运动质量、视觉质量、风格和多目标等14个主要维度和26个子维度测试中，万相均达到了业界领先表现，并且斩获5项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升，万相能够稳定展现各种复杂的人物肢体运动，如旋转、跳跃、转身、翻滚等；能够精准还原碰撞、反弹、切割等复杂真实物理场景。

自2023年8月起，阿里云相继开源Qwen系列大语言模型，覆盖从0.5B到110B的全尺寸参数，形成全球最大的开源模型家族，衍生模型数量已突破10万。此次万相2.1的开源延续了这一战略。