昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

开源地址:

1、SkyReels-V1:https://github.com/SkyworkAI/SkyReels-V1

2、SkyReels-A1:https://github.com/SkyworkAI/SkyReels-A1

3、技术报告:https://skyworkai.github.io/skyreels-a1.github.io/report.pdf

4、SkyReels官方地址:skyreels.ai

1. SkyReels-V1:Human-Centric Video Foundation Model,中国首个面向AI短剧创作的开源视频生成模型

SkyReels-V1可实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。正如以下视频所示,SkyReels-V1支持生成大笑、怒吼、惊讶、哭泣等微表情,展现出人物情感丰沛的表演细节。即使有大幅度肢体动作,SkyReels-V1生成的微表情也完美贴合人物肢体表演。

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

同时,SkyReels-V1为AI视频生成带来了电影级光影美学,基于好莱坞级的高质量影视数据训练,当前SkyReels生成的每一帧画面,在构图、演员站位、相机角度等都具备电影级的质感。无论是单人镜头表演细节,还是多人构图,当前已具备精准的表情控制和高质感画面。

更重要的是,SkyReels-V1不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

图1丨SkyReels-V1文生视频指标对比(来源:昆仑万维SkyReels)

能够实现这样的SOTA级别,不仅依赖于昆仑万维SkyReels团队基于自研的高质量数据清洗和人工标注管线,构建了千万级的高质量电影&电视剧&纪录片数据。更依托团队自研「Human-Centric」的视频理解多模态大模型,大幅提升视频中人物相关的理解能力,尤其是自研人物智能解析系统。

综上所述,得益于扎实的数据工作和先进的人物智能解析系统,SkyReels-V1可以实现:

影视化表情识别体系:11种针对影视戏剧中的人物表情理解,如不屑、不耐烦、无助、厌恶等表情的理解;

人物空间位置感知:基于人体三维重建技术,实现对视频中多人的空间相对关系理解,助力模型生成影视级人物站位;

行为意图理解:构建超过400种行为语义单元,实现对人物行为的精准理解;

表演场景理解:实现人物-服装-场景-剧情的关联分析。

SkyReels-V1不仅是全球极少数开源的视频生成模型,还是围绕人物表演、开源视频生成模型中性能最强的。

在自研推理优化框架「SkyReels-Infer」的加持下,大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行,支持Context Parallel,CFG Parallel,和 VAE Parallel。此外,采取fp8 quantization以及parameter-level offload,满足低显存用户级显卡运行需求;支持flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源diffuser库,提升易用性。

正如下图2所示,在同等RTX4090资源情况下对比(4卡),SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s);SkyReels-Infer版本具备更鲁棒的部署策略,支持用户级别显卡1卡-8卡的推理部署。

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

图2丨推理生成544p视频,使用相同卡数的RTX 4090,SkyReels-Infer版本端到端延迟优于HunyuanVideo官方(xdit) 58.3%

在同等A800资源情况下对比,SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少14.7%~28.2%(如图3所示),SkyReels-Infer版本具备更鲁棒的多卡部署策略。

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

图3丨推理生成544p视频,SkyReels-Infer版本具备更鲁棒的多卡部署策略,支持8卡部署

2.SkyReels-A1:首个SOTA级别的基于视频基座模型的表情动作可控算法

为了实现更加精准可控的人物视频生成,昆仑万维还开源了SOTA级别的基于视频基座模型的表情动作可控算法SkyReels-A1,对标Runway的Act-One,SkyReels-A1支持视频驱动的电影级表情捕捉,实现高保真微表情还原。能够基于任意人体比例(包括肖像、半身及全身构图)生成高度逼真的人物动态视频,其真实感源自对人物表情变化和情绪的精准模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。

SkyReels-A1不仅支持侧脸的表情控制生成、还能实现更加逼真的眉眼微表情生成和更大幅度的头部与自然身体动作。SkyReels-A1能够实现更大幅度的人物表情驱动。相比Runway的Act-One,SkyReels-A1可以迁移更复杂的表情动作,生成的人物面部神情可以配合肢体及画面内容实现更栩栩如生的表演。

3.以开源之姿,以破局之势,昆仑万维致力于推动全球AI短剧创作生态繁荣发展

昆仑万维一直坚持开源,推动技术平权。昆仑万维同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。

我们相信在进行推理优化的升级和可控算法的开源后,它们将为用户带来低成本、可控性更强的AIGC能力。昆仑万维希望通过更多优秀视频生成模型的开源和极致的AI短剧产品能力,为用户带来低成本实现AI短剧创作的可能性、突破行业目前视频生成一致性差的问题,让大众通过自己的电脑生成精细且可控的人物表演。

此次开源的视频大模型,不仅是一次技术突破,有助于缩小全球内容产业的数字鸿沟,更是文化产业生产力的一次革命。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合。AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。

“实现通用人工智能,让每个人更好地塑造和表达自我”是公司的使命,未来,昆仑万维及SkyReels还将开源更多视频生成模型和算法、通用模型,通过开源实现AGI平权,推动AI短剧生态的持续建设和繁荣,促进开源社区、开发生态以及AI行业的发展。

免责声明

               

本文转载自网络平台,发布此文仅为传递信息,本文观点不代表本站立场,版权归原作者所有;不代表赞同其观点,不对内容真实性负责,仅供用户参考之用,不构成任何投资、使用等行为的建议。请读者使用之前核实真实性,以及可能存在的风险,任何后果均由读者自行承担。

本网站提供的草稿箱预览链接仅用于内容创作者内部测试及协作沟通,不构成正式发布内容。预览链接包含的图文、数据等内容均为未定稿版本,可能存在错误、遗漏或临时性修改,用户不得将其作为决策依据或对外传播。

因预览链接内容不准确、失效或第三方不当使用导致的直接或间接损失(包括但不限于数据错误、商业风险、法律纠纷等),本网站不承担赔偿责任。用户通过预览链接访问第三方资源(如嵌入的图片、外链等),需自行承担相关风险,本网站不对其安全性、合法性负责。

禁止将预览链接用于商业推广、侵权传播或违反公序良俗的行为,违者需自行承担法律责任。如发现预览链接内容涉及侵权或违规,用户应立即停止使用并通过网站指定渠道提交删除请求。

本声明受中华人民共和国法律管辖,争议解决以本网站所在地法院为管辖法院。本网站保留修改免责声明的权利,修改后的声明将同步更新至预览链接页面,用户继续使用即视为接受新条款。

Previous 2025-02-17 下午6:14
Next 2025-02-18 下午9:14

相关推荐

  • 兴嘉生物董事长黄逸强受聘为中国饲料工业协会战略咨询专家组成员

    2025年11月17日,中国饲料工业协会在武汉隆重举行战略咨询专家组成立大会。国务院参事、农业农村部原副部长于康震,中国饲料工业协会会长王宗礼出席会议并讲话,中国饲料工业协会副会长兼秘书长秦玉昌主持会议。      中国饲料工业协会战略咨询专家组由中国工程院姚斌院士、侯水生院士、谯仕彦院士等行业专家,以及温氏股份董事长温志芬、海…

    7小时前
    0
  • 碧水红心 安澜流溪 以系统治理守护广州“母亲河”

    https://v2.cri.cn/5ff2575e-563a-45ca-835a-7c597deb3c5f/video/7add78260a144be48c8b896df5ce35d0.mp4 流溪河,广州的发展动脉 流溪河,位于珠江三角洲中北部,是广州的“母亲河”。她从从化区吕田镇桂峰山发源,穿行于峭壁幽谷之间,奔涌于平原沃野之上,最终在南岗口汇入珠江西…

    7小时前
    0
  • 构建未来智能世界技术底座:2025空间计算大会将发布核心成果

    当前,空间计算正成为全球科技产业竞争的核心方向。作为连接数字世界与真实物理空间的关键技术,它正在推动 XR 终端、机器人、AI 数字人、智能网联汽车等新兴产业进入新一轮创新周期。随着行业从概念探索迈向规模化落地,构建自主可控的底层技术体系愈发重要。 为了推动产业关键环节补短板、强基石,2025空间计算大会将于11月27日在浙江宁波举行。大会由中国移动通信联合…

    15小时前
    0
  • 《向阳新程》聚焦科技赋能传播 专访赵洋:以创新坚守民营服务初心

    《向阳新程》聚焦科技赋能传播 专访赵洋:以创新坚守民营服务初心 10月28日,《向阳新程——民营经济高质量发展》纪录片摄制组走进北京沈阳商会,对北京市青年创业导师、海淀区工商联委员、华云创鼎(北京)科技有限公司创始人赵洋开展专访。作为深耕数字化新媒体宣传领域20年的创业者,长期为中央企业、国有企业及事业单位提供全流程宣传服务。结合行业迭代历程与企业实践,赵洋…

    1天前
    0
  • 部委联合发布环保技术装备目录,量子点光谱传感技术入选推广名单

    一部被行业视为技术发展“风向标”的国家级目录正式公示,为环保装备产业的创新与推广划出了重点。   2025年11月7日,工业和信息化部与生态环境部联合发布《国家鼓励发展的重大环保技术装备目录(2025年版)》,并正式进入公示程序。该目录共收录115项先进技术装备,涵盖大气、水、固废处理及环境监测等11个重点领域,为“十四五”后期环保装备产业的高质量…

    2天前
    0