设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯开源视频生成新工具,论文还没发先上代码的那种

发布时间: 来源: 量子位

支持文本图像视频输入AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

先上代码再发论文,腾讯新开源文生视频工具火了。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

老规矩,先看效果。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

静态的金克丝秒秒钟就能动起来朝你抛媚眼:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

画中诗圣也“活”了过来:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

各种风格都能驾驭,风景图也不在话下:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

更有搞笑风《微笑的骑士》:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

再上难度,复杂些的弹唱也处理得比较自然:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

此外,加入“骨架”控制动作、姿势也可以:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

腾讯这次论文还没发直接放出训练好的模型和部署运行的代码的操作让网友眼前一亮。主页显示训练代码也即将推出。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不少人已趁热码住,GitHub获星500+。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

还有网友已经玩上了:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

围观网友直呼距离成为视频达人只差一个AI。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

嘴唇也能同步

除了直接放出模型代码,目前MuseV还有demo可体验。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

demo界面有两种玩法。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一种可以上传一张图然后加上Prompt在这张图的基础上进行视频生成;另一种是上传一个参考视频和一张图,使图片中的内容按照视频中的动作运动起来。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

紧接着下方还有一些参数可以调整。可以自定义视频的时长以及视频的尺寸。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

此外值得一提的是,文本、图像到视频的生成结果的所有帧直接由MuseV生成,没有时序超分辨、空间超分辨等任何后处理。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而输入视频控制姿态的生成模式下,开发团队表示需要参考视频的首帧条件和参考图像的首帧条件对齐,不然会破坏首帧的信息,效果会更差。所以一般生成流程是:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 确定参考视频;
  • 用参考视频的首帧走图生图、controlnet流程,可以使用MJ等各种平台;
  • 拿第二步中的生成图、参考视频用MuseV生成视频。
腾讯开源视频生成新工具,论文还没发先上代码的那种

除MuseV,开发团队还表示即将发布一个实时高质量的唇同步模型——MuseTalk,可与MuseV一起搭配使用。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

MuseV里面长啥样?

技术方面,据了解MuseV是在去年7月左右基于扩散模型实现的技术进展,受到Sora启发,开发团队决定开源MuseV,之后将转向扩散+Transformer方案。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,MuseV是基于扩散模型的虚拟人视频生成框架AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

模型架构如下图所示:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

总的来说,MuseV具有以下特点:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先是支持使用新颖的视觉条件并行去噪方案进行无限长度生成,不会再有误差累计的问题,尤其适用于固定相机位的场景。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

并行去噪算法示意图如下:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

其次,MuseV提供了基于人物类型数据集训练的虚拟人视频生成预训练模型。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而且支持图像到视频、文本到图像到视频、视频到视频的生成;兼容Stable Diffusion文图生成生态系统,包括base_model、lora、controlnet等。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还支持多参考图像技术,包括IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID。AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[1]https://github.com/TMElyralab/MuseVAgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://twitter.com/Gorden_Sun/status/1774825159939256678AgD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。该民航科技创新示范区相关负责人表示,预计模 春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日力量”吧!春日关键词:温暖空间站内 四季如春 2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个   我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面级,成功将云海二号02组卫星发射升空,卫星顺利   盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明  澎湃新闻记者 吴遇利  Neuralink新技术或将造福数千万名失明人士。  当地时间3月21日,特斯拉CEO埃隆・马斯克在社交平台X(原推特)发文称, 据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出租车在2030年广泛使用铺平道路。尽管在最初 。

本文链接:腾讯开源视频生成新工具,论文还没发先上代码的那种http://www.sushuapos.com/show-2-4575-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

下一篇: 英伟达AI新课爆火!免费学习,干货满满

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜