盘前机会前瞻|阿里宣布视频大模型万相2.1开源!这几家公司在文生视频和AI短视频领域已服务众多客户有望受益(附概念股)

盘前机会前瞻|阿里宣布视频大模型万相2.1开源!这几家公司在文生视频和AI短视频领域已服务众多客户有望受益(附概念股)

我能黑 2025-02-26 实时报 11 次浏览 0个评论

2月25日,从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。在视频生成方面,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。

【机会前瞻】

2月25日,阿里巴巴集团宣布将旗下文生视频模型“万相2.1”全面开源。作为全球首个支持中英双语、首个实现无限长1080P视频编解码的开源模型,万相2.1的开放不仅打破了专业视频创作的技术壁垒,更可能重构全球AIGC产业的竞争格局。

万相2.1采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,全球开发者可在Github、HuggingFace和魔搭社区下载体验。其中1.3B版本仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。在视频VAE方面,万相2.1设计了创新的视频编解码方案,通过将视频拆分成若干块并缓存中间特征的方式,代替直接对长视频的E2E编解码过程,实现显存使用与原始视频长度无关,支持无限长1080P视频的高效编解码。万相2.1在视频生成领域的权威评测集VBench上以总分84.7%的成绩登顶,在运动幅度、多对象生成、空间关系等16个评分维度中的多个关键能力上拿下最高分。

万相团队的实验结果显示,在运动质量、视觉质量、风格和多目标等14个主要维度和26个子维度测试中,万相均达到了业界领先表现,并且斩获5项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。

盘前机会前瞻|阿里宣布视频大模型万相2.1开源!这几家公司在文生视频和AI短视频领域已服务众多客户有望受益(附概念股)

自2023年8月起,阿里云相继开源Qwen系列大语言模型,覆盖从0.5B到110B的全尺寸参数,形成全球最大的开源模型家族,衍生模型数量已突破10万。此次万相2.1的开源延续了这一战略。

转载请注明来自小白菜,本文标题:《盘前机会前瞻|阿里宣布视频大模型万相2.1开源!这几家公司在文生视频和AI短视频领域已服务众多客户有望受益(附概念股)》

每一天,每一秒,你所做的决定都会改变你的人生!