设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

2024-03-17 20:21:29 来源: 量子位

腾讯混元联合清华和港科大推出u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

单击画面中的火箭,输入“发射”prompt,瞬间起飞!u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

就连想要回收火箭,也只需要输入“Launch down”,再轻轻一点击:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

马斯克看了都要自我怀疑一下,这火箭发射这么简单,自家星舰成功进入太空怎么那么难(开个小玩笑)??u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

以上效果来自一个新的图生视频模型Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

食用方法非常友好:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

任意一张照片输入模型,只需要点击对应区域,加上少量简单的提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就连《一人之下》的诸葛青和《唐伯虎点秋香》里的星爷也……u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

相关研究论文已经挂上了arXiv,GitHub上也放出代码,首日就小有战绩,揽星280+。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

想动哪里点哪里,so easy

注意看这个楼梯上的动画小鼠形象,只需单击小鼠腹部,再输入“跳舞”,它就能瞬间扭动起来。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,画面的其他部分保持原有的静止状态。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

不只是人物、卡通形象可以控制,图片的其余部分,通过点击和输入简短提示词,也能动起来。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

,时长00:08u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

进一步测试,是可以实际感知到Follow-Your-Click对画面动态部分的精准控制的。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同样是鸟图,点击小鸟,输入“动动脑袋”:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“扇扇翅膀”:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“跳个舞吧”:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“不如摇摆”:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

总结,就是想要哪里动,就点哪里。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究团队还将Follow-Your-Click和其他视频生成模型进行了同题对比,以下是实验效果:u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

一键点,万物动

此前图生视频模型的生成方法,一般都需要用提示词描述运动区域,并提供运动指令的详细描述。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从生成效果来看,过往技术在指定图像移动部分缺乏控制,往往是让整个场景动起来,而不是具体到图像上的某个区域。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

为了解决这些问题,腾讯混元大模型团队、清华和港科大联合项目提出了更实用和可控的图像到视频生成模型Follow-Your-Click。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实现方式上,Follow-Your-Click首先整合了图像语义分割工具Segment-Anything,将用户点击转换为二进制区域Mask,将其作为网络条件之一。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,为了更好地正确学习时间相关性,团队还引入了一种有效的首帧掩模策略u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方式对模型生成的视频质量有较大的性能提升,不论是在畸变还是首帧的重构效果上都有很大的帮助。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,为了实现简短提示词的文字驱动能力,研究团队构建了一个名为WebVid-Motion的数据集——利用大模型来过滤和注视视频标题,并强调人类情感、动作和常见物体的运动,通过数据集提升模型对动词的响应和识别能力。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

联合研究团队还设计了一个运动增强模块,主要用途一方面是更好地适应数据集,一方面用来增强模型对运动相关词语的响,同时理解简短提示指令。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

在视频中,不同类型的物体可能表现出不同的运动速度。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以往的工作中,每秒帧数(FPS)主要作为全局的动作幅度控制参数,间接调整多个物体的运动速度。然而,它无法有效控制移动物体的速度。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

举个u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

,一个展示雕塑的视频可能具有很高的FPS,但是没有物体的运动速度。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了实现对运动速度的准确学习,研究团队提出了一种基于光流的运动幅度控制,使用光流模长作为新的视频运动幅度控制参数。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

以上这些新提出的方法,加上各模块的组合,Follow-Your-Click大大提升了可控图生视频的效率和可控性,最终实现了用简单文本指令来实现图像局部动画。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

One More Thing

小道消息!u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Follow-Your-Click联合项目组中的腾讯混元大模型团队,正努力研究和探索多模态技术。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此前,该团队已经作为技术合作伙伴,支持了《人民日报》的原创视频《江山如此多娇》。u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该说不说,2024年,一定是多模态卷到爆炸的一年……u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

项目主页:https://follow-your-click.github.io/u6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
论文链接:https://arxiv.org/pdf/2403.08268.pdfu6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
GitHub:https://github.com/mayuelala/FollowYourClicku6P速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源http://www.sushuapos.com/show-2-3862-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 国产大模型创业一哥:秀商业化,布局Sora,“全线对标OpenAI”

下一篇: 开源版“Devin”AI程序员炸场:自己分析股票、做报表、建模型

热门资讯

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 打造平台级AI 引领行业创新

    3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣

  • 负碳复合建材助力减缓全球变暖

    美国太平洋西北国家实验室的科学家设计了一种复合装饰材料,可以储存更多二氧化碳,提供了一种既符合建筑规范,又比标准复合饰面板便宜的“负碳”选择。

  • 感染新冠会“导致智商下降”吗?

    据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生

  • 人工智能重新定义职场技能

    据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道,在人工智能(AI)迅速重新定义就业格局的今天,通常被称为“软”技能的人类技能成为最有韧性、最有价值

  • 地下水位上升 生态用水充足——华北地区地下水超采综合治理成效显著

    “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源

  • 量子互联网:小荷已露尖尖角

    近日,美国纽约州立大学石溪分校科学家菲格罗阿等人在一篇发表于《自然·量子信息》上的论文中称,他们通过把两个独立的光子存储在铷气里,首次在

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!

      “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!  财联社3月20日讯(编辑 黄君芝)巴西亿万富翁、巴西金融公司Banco BTG Pactual SA创始人Andre Esteves表示,人工智能(AI

  • 尚德机构2023年净收入21.6亿元 详细披露老年教育进展

    21世纪经济报道记者王峰北京报道 近日,成人职业在线教育企业尚德机构(NYSE:STG)公布了其2023年第四季度及全年未经审计的财务报告。2023年

  • 科研团队首次揭示全国范围内蚊虫病毒组特征

    记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理

  • 北京首例负碳示范建筑正式亮相

    3月22日,在2024低碳建筑产业论坛上,北京首例负碳示范建筑——首程时代中心负碳示范建筑正式亮相。活动现场,中国建筑节能协会、北京绿色交

推荐资讯

  • 日榜
  • 周榜
  • 月榜