昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1，重塑AI短剧行业格局

发布时间: 2025-02-19 09:39:35 来源：

观看：93

2月18日，昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

1. SkyReels-V1：Human-Centric Video Foundation Model，中国首个面向AI短剧创作的开源视频生成模型

SkyReels-V1可实现影视级人物微表情表演生成，支持33种细腻人物表情与400+种自然动作组合，高度还原真人情感表达。正如以下视频所示，SkyReels-V1支持生成大笑、怒吼、惊讶、哭泣等微表情，展现出人物情感丰沛的表演细节。即使有大幅度肢体动作，SkyReels-V1生成的微表情也完美贴合人物肢体表演。

同时，SkyReels-V1为AI视频生成带来了电影级光影美学，基于好莱坞级的高质量影视数据训练，当前SkyReels生成的每一帧画面，在构图、演员站位、相机角度等都具备电影级的质感。无论是单人镜头表演细节，还是多人构图，当前已具备精准的表情控制和高质感画面。

更重要的是，SkyReels-V1不仅支持文生视频、还能支持图生视频，是开源视频生成模型中参数最大的支持图生视频的模型，在同等分辨率下各项指标实现开源SOTA。

图1丨SkyReels-V1文生视频指标对比（来源：昆仑万维SkyReels）

能够实现这样的SOTA级别，不仅依赖于昆仑万维SkyReels团队基于自研的高质量数据清洗和人工标注管线，构建了千万级的高质量电影&电视剧&纪录片数据。更依托团队自研「Human-Centric」的视频理解多模态大模型，大幅提升视频中人物相关的理解能力，尤其是自研人物智能解析系统。

综上所述，得益于扎实的数据工作和先进的人物智能解析系统，SkyReels-V1可以实现：

影视化表情识别体系：11种针对影视戏剧中的人物表情理解，如不屑、不耐烦、无助、厌恶等表情的理解；

人物空间位置感知：基于人体三维重建技术，实现对视频中多人的空间相对关系理解，助力模型生成影视级人物站位；

行为意图理解：构建超过400种行为语义单元，实现对人物行为的精准理解；

表演场景理解：实现人物-服装-场景-剧情的关联分析。

SkyReels-V1不仅是全球极少数开源的视频生成模型，还是围绕人物表演、开源视频生成模型中性能最强的。

在自研推理优化框架「SkyReels-Infer」的加持下，大幅提升推理效率，实现544p分辨率，推理基于单台4090只需80s，还支持分布式多卡并行，支持Context Parallel，CFG Parallel，和 VAE Parallel。此外，采取fp8 quantization以及parameter-level offload，满足低显存用户级显卡运行需求；支持flash attention、SageAttention，模型编译优化等，进一步优化延迟；基于开源diffuser库，提升易用性。

正如下图2所示，在同等RTX4090资源情况下对比(4卡)，SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s)；SkyReels-Infer版本具备更鲁棒的部署策略，支持用户级别显卡1卡-8卡的推理部署。

图2丨推理生成544p视频，使用相同卡数的RTX 4090，SkyReels-Infer版本端到端延迟优于HunyuanVideo官方(xdit) 58.3%

在同等A800资源情况下对比，SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少14.7%～28.2%（如图3所示），SkyReels-Infer版本具备更鲁棒的多卡部署策略。

图3丨推理生成544p视频，SkyReels-Infer版本具备更鲁棒的多卡部署策略，支持8卡部署

2.SkyReels-A1：首个SOTA级别的基于视频基座模型的表情动作可控算法

为了实现更加精准可控的人物视频生成，昆仑万维还开源了SOTA级别的基于视频基座模型的表情动作可控算法SkyReels-A1，对标Runway的Act-One，SkyReels-A1支持视频驱动的电影级表情捕捉，实现高保真微表情还原。能够基于任意人体比例（包括肖像、半身及全身构图）生成高度逼真的人物动态视频，其真实感源自对人物表情变化和情绪的精准模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。

SkyReels-A1不仅支持侧脸的表情控制生成、还能实现更加逼真的眉眼微表情生成和更大幅度的头部与自然身体动作。SkyReels-A1能够实现更大幅度的人物表情驱动。相比Runway的Act-One，SkyReels-A1可以迁移更复杂的表情动作，生成的人物面部神情可以配合肢体及画面内容实现更栩栩如生的表演。

3.以开源之姿，以破局之势，昆仑万维致力于推动全球AI短剧创作生态繁荣发展

昆仑万维一直坚持开源，推动技术平权。昆仑万维同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源，是AI短剧行业首例，也是昆仑万维SkyReels回馈行业迈出的一小步，更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。

我们相信在进行推理优化的升级和可控算法的开源后，它们将为用户带来低成本、可控性更强的AIGC能力。昆仑万维希望通过更多优秀视频生成模型的开源和极致的AI短剧产品能力，为用户带来低成本实现AI短剧创作的可能性、突破行业目前视频生成一致性差的问题，让大众通过自己的电脑生成精细且可控的人物表演。

此次开源的视频大模型，不仅是一次技术突破，有助于缩小全球内容产业的数字鸿沟，更是文化产业生产力的一次革命。未来，短剧与游戏、虚拟现实等领域的跨界发展，将会加速产业融合。AI短剧也有希望从“技术实验”迈向“主流创作”，成为全球文化输出的新载体。

“实现通用人工智能，让每个人更好地塑造和表达自我”是公司的使命，未来，昆仑万维及SkyReels还将开源更多视频生成模型和算法、通用模型，通过开源实现AGI平权，推动AI短剧生态的持续建设和繁荣，促进开源社区、开发生态以及AI行业的发展。（中国网）

近日，法大大与企业绿色发展研究院联合发布了《2023年签约减碳与低碳办公白皮书》，该白皮书基于《低碳办公评价》标准倡导的创新减碳技术应用方向，深入剖析企业低碳办公场景及签约减碳价值。为践行“双碳在天津业界和滨海新区，她获得的尊称是“朱会长”，“朱总”，昵称“华姐”，让我们更看重是她的名字，有点天注定的：学华。发即人华。她起初学的是理发，做的是头发。她身上荣誉很多，头衔很多：区政协委员、工商联执近日，奔驰宣布放弃全面电动化目标，与宝马合资在华成立充电公司，共同运营超级充电网络，满足中国客户对豪华充电服务的需求。注册信息显示，新公司的两大股东分别是华晨宝马汽车有限公司和梅赛德斯-奔驰（中国）投资有限公司，股比 3月5日上午，十四届全国人大二次会议在人民大会堂举行开幕会。开幕会后，首场“部长通道”开启，科技部部长阴和俊、水利部部长李国英、农业农村部部长唐仁健、 *** 国有资产监督管理委员会主任张玉卓走上“部长通道”，展现 2024年1月，杭州虚之实科技有限公司（简称"虚之实"）接连受到国际认可！其核心产品之一的VR认知功能康复系统，先是获得了TFDA颁发的《医疗器械注册证》，接着又成功通过了欧盟的CE认证。这些认证不仅是对虚之实美式豪华再进化全新电混林肯Z与全新电混林肯冒险家焕新上市林肯开辟新能源自有赛道，林肯电混大家族彻底颠覆对传统“美式豪华”固有的“高油耗”认知，解决纯电里程的焦虑，带来“零焦虑”的全场景一致。

本文链接：昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1，重塑AI短剧行业格局http://www.sushuapos.com/show-1-35724-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：续创佳绩! 轻喜到家与顺丰、跨越等一同入选“2024年航城街道服务业十强”

下一篇：英莱科技激光视觉焊缝跟踪系统全新PF系列新品发布，三大技术融合，强悍来袭

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1，重塑AI短剧行业格局

热门资讯

推荐资讯

快讯最热文章