设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

发布时间: 来源: 量子位

腾讯混元联合清华和港科大推出Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

单击画面中的火箭,输入“发射”prompt,瞬间起飞!Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

就连想要回收火箭,也只需要输入“Launch down”,再轻轻一点击:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

马斯克看了都要自我怀疑一下,这火箭发射这么简单,自家星舰成功进入太空怎么那么难(开个小玩笑)??Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

以上效果来自一个新的图生视频模型Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

食用方法非常友好:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

任意一张照片输入模型,只需要点击对应区域,加上少量简单的提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就连《一人之下》的诸葛青和《唐伯虎点秋香》里的星爷也……Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

相关研究论文已经挂上了arXiv,GitHub上也放出代码,首日就小有战绩,揽星280+。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

想动哪里点哪里,so easy

注意看这个楼梯上的动画小鼠形象,只需单击小鼠腹部,再输入“跳舞”,它就能瞬间扭动起来。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,画面的其他部分保持原有的静止状态。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

不只是人物、卡通形象可以控制,图片的其余部分,通过点击和输入简短提示词,也能动起来。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

,时长00:08Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

进一步测试,是可以实际感知到Follow-Your-Click对画面动态部分的精准控制的。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同样是鸟图,点击小鸟,输入“动动脑袋”:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“扇扇翅膀”:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“跳个舞吧”:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

输入“不如摇摆”:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

总结,就是想要哪里动,就点哪里。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究团队还将Follow-Your-Click和其他视频生成模型进行了同题对比,以下是实验效果:Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

一键点,万物动

此前图生视频模型的生成方法,一般都需要用提示词描述运动区域,并提供运动指令的详细描述。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从生成效果来看,过往技术在指定图像移动部分缺乏控制,往往是让整个场景动起来,而不是具体到图像上的某个区域。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

为了解决这些问题,腾讯混元大模型团队、清华和港科大联合项目提出了更实用和可控的图像到视频生成模型Follow-Your-Click。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实现方式上,Follow-Your-Click首先整合了图像语义分割工具Segment-Anything,将用户点击转换为二进制区域Mask,将其作为网络条件之一。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,为了更好地正确学习时间相关性,团队还引入了一种有效的首帧掩模策略Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方式对模型生成的视频质量有较大的性能提升,不论是在畸变还是首帧的重构效果上都有很大的帮助。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,为了实现简短提示词的文字驱动能力,研究团队构建了一个名为WebVid-Motion的数据集——利用大模型来过滤和注视视频标题,并强调人类情感、动作和常见物体的运动,通过数据集提升模型对动词的响应和识别能力。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

联合研究团队还设计了一个运动增强模块,主要用途一方面是更好地适应数据集,一方面用来增强模型对运动相关词语的响,同时理解简短提示指令。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

在视频中,不同类型的物体可能表现出不同的运动速度。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以往的工作中,每秒帧数(FPS)主要作为全局的动作幅度控制参数,间接调整多个物体的运动速度。然而,它无法有效控制移动物体的速度。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

举个Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

,一个展示雕塑的视频可能具有很高的FPS,但是没有物体的运动速度。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了实现对运动速度的准确学习,研究团队提出了一种基于光流的运动幅度控制,使用光流模长作为新的视频运动幅度控制参数。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源

以上这些新提出的方法,加上各模块的组合,Follow-Your-Click大大提升了可控图生视频的效率和可控性,最终实现了用简单文本指令来实现图像局部动画。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

One More Thing

小道消息!Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Follow-Your-Click联合项目组中的腾讯混元大模型团队,正努力研究和探索多模态技术。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此前,该团队已经作为技术合作伙伴,支持了《人民日报》的原创视频《江山如此多娇》。Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该说不说,2024年,一定是多模态卷到爆炸的一年……Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

项目主页:https://follow-your-click.github.io/Ckh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
论文链接:https://arxiv.org/pdf/2403.08268.pdfCkh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
GitHub:https://github.com/mayuelala/FollowYourClickCkh速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

南方财经全媒体记者 吴立洋 上海报道日前,2024中国家电及消费电子博览会(AWE)在上海新国际博览中心闭幕。作为一年一度的家电产业盛会,AWE既是各大厂商展示新技术与新产品的重要节点,也是 21世纪经济报道见习记者 顾婷婷 杭州报道如何让沉睡在实验室里的专利真正应用到车间,真正面向市场,转化为真正的新质生产力?3月19日,由国家知识产权局组织的高校和科研机构存量专利盘活 美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同时也是一本关于新兴技术在医疗领域应用的新 科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘长征八号遥三运载火箭从文昌航天发射场发射 自2019年以来,科学家已经在国际空间站上培育出了包括人类大脑、心脏和乳房在内的多个类器官模型。这些类器官通常利用人类干细胞培育而成,在一系列化学生长物质的帮助下,干细胞可发育成类似人体 3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤波器件安装于传统无标记光学显微镜的出射端, 。

本文链接:腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源http://www.sushuapos.com/show-2-3862-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 国产大模型创业一哥:秀商业化,布局Sora,“全线对标OpenAI”

下一篇: 开源版“Devin”AI程序员炸场:自己分析股票、做报表、建模型

热门资讯

  • 明天氢能荣获国家电网科技进步奖一等奖

    记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为

  • 电驱气吸播种机亮相农机展,价格亲民助增产

    3月18日,在2024年黑龙江农机产品展示交易会上,一部可智能播种,又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械

  • 银鲳高质量染色体水平 参考基因组发布

    3月19日,记者从中国科学院海洋研究所了解到,该所研究团队在国际上首次发布了银鲳的高质量染色体水平参考基因组。相关研究论文近日在线发表于《自然

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • 单个颗粒无标记光学显微成像实现

    记者3月21日从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。该滤波器件安装

  • 全球首列氢能源市域列车完成满载运行试验

    3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 我国网民规模达10.92亿人:互联网普及率77.5%!

    3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12

  • 首款骁龙8 Gen3折叠屏!vivo X Fold3图赏

    3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供

  • huaweiP70系列发布在即!供应链已开始批量供货:出货目标相当乐观

    3月24日消息,据媒体报道,huawei电话供应链公司,已开始向huaweiP70系列高端旗舰电话批量供货。同时有产业链人士透露,huawei给出的P70系列出货目标指引相对

  • 千元机皇 小8Gen3+1.5K直屏+5500mAh大电池 有点香啊!

    回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都

推荐资讯

  • 日榜
  • 周榜
  • 月榜