设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

2024-05-08 09:13:35 来源: 量子位

Sora后第二火的AI视频技术V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

衡宇 梦晨 发自 凹非寺V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIV8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

等了7分多钟,刚从北京闪现闪离的马斯克,他终于夸我是个人才:V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩好了,别骂诈骗,我全都招!V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

现在登录通义App(原通义千问),选择全民演唱功能,只需上传任意一张人物正面大头照,你也能玩儿了。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个功能开放不到一周时间,但经量子位观察,还挺火。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

热度一直没掉下去,关键是生成时间也跟热度一起高居不下,顺利的话几分钟生成的小视频,挤的时候排队能排出好几个小时开外,亏得是阿里云服务器没被挤爆(不是)。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从国内外的网友分享反馈来看,大家还挺喜欢文艺复兴,最受欢迎的片段是让个路人马轮番演唱《野狼Disco》。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了唱歌,还能把朋友放进(非)著名表情包念台词。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

玩儿梗的人太多,以至于马斯克都给搞EMO了:V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩而这背后的“始作俑者”,就是来自阿里通义实验室的EMO,继Sora之后热度第二高的AI视频项目。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如今一个月过去,星标数已经直奔7k而去。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

趁此热度,我们也得到了一个与EMO背后大佬,阿里通义实验室XR实验室负责人薄列峰当面催更的机会。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他表示在放心把技术开源之前,首先还是要解决安全问题。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

负责人讲解背后技术

距项目公开仅2个月,通义实验室团队就直接将这一技术免费开放,但所有人都可以在通义APP(原通义千问)体验全新的AIGC玩法。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果你想亲自上手试试,打开对话输入“EMO”直达或进入“频道”选择“全民舞台”即可。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

选择喜欢的音频片段,并上传一张大头照。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果在热门时段,需要等待40分钟到几个小时不等,但其实主要是在排队。薄列峰透露,单纯生成10秒视频,只需要10-15分钟V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

对于上传的照片,系统首先会进行人脸检测,不过有些长得太像人的动物也能顺利蒙混过关!V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如撞脸莫言的小狗,就成功地骗过了系统。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但是撞脸余华的小狗就没那么幸运了,系统一下子就把它给识破了(没有任何对余华老师不敬的意思)。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

为什么只需要上传一张图就能立即做到逼真效果?V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

薄列峰介绍,EMO的核心思路是“弱控制设计”,无需对整个面部建模,这一点甚至体现在了论文标题上。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

在生成过程中,面部定位器(Face Locator)用来编码面部的边界框区域。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

速度编码器(Speed Encoder)确保头部运动的速度与音频的节奏和强度相匹配。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些控制机制被称为“弱控制”是因为它们提供的控制不是强制性的或硬性的,而是允许一定程度的自然变化和表现力。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,面部区域控制器并不严格限定面部的具体位置,而是给出了一个允许面部运动的较大区域。同样,速度控制器并不精确控制每一帧的速度,而是提供一个速度范围,让生成的头部运动接近但不一定完全符合指定的速度水平。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过使用这些弱条件,EMO框架能够在保持角色身份一致性的同时,生成具有丰富表情和自然头部运动的视频,从而在表达性和逼真度方面取得更好的效果。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比起传统的分别针对眼睛鼻子嘴等部位的建模方案,EMO更着重考虑整个面部的联合运动,最终效果也就可以做到自然流畅了。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

另外薄列峰还透露,选择这个技术路线也是出于实用性、普及性的考虑。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一张图、一段音频,每个人都非常容易获取,门槛低一些,让大家都能玩起来。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

关于EMO的技术选择,薄列峰还透露了一个消息。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然EMO使用传统基于U-net的扩散模型架构,但Pipeline是解耦的,如果后续尝试Sora同款DiT架构做到更好效果的话,也可以轻松切换过去V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于未来发展方向,EMO目前只做了人头,将来还会扩展到半身、全身。到时候,能实现一张照片让人物同时唱跳RAP篮球也说不定。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高于平均水平的AIGC内容才会被消费

在此之前,EMO背后通义实验室所推项目中,最火的是与EMO一脉相承的Animate Anyone模型。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

代表杰作:奶牛猫跳舞V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

算法原理上,EMO和Animate Anyone都采用了Backbone + ReferenceNet的结构,实现有参考图像引导的去噪生成过程。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中,Animate Anyone在实现了保留特定对象ID的生成式模型的基础上,进一步证明可以通过一些输入控制信号控制生成内容,特别是人物的动作。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所以其实背后团队是专注数字人的团队,没想到在通义App上包装成“全民舞王”后,大家对动物玩法更感兴趣。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩

一个多月前,团队还在全民舞王针对小猫小狗等动物主体检测做了一半优化,使上传动物照片的通过率大幅度提升。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

即使检测出来用户上传的是动物,只要通过了骨骼检测,啥小动物都可以起来嗨。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“现在技术确实可以生成很多的图片、视频,但如果他们都是平均甚至低于平均水平,大家不见得有兴趣去消费。”薄列峰笑道,奶牛猫跳舞确实很妖娆,“这给我们把链路打通带来更多的思考——把简单高质量的内容,通过新技术去实现可能。”V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

聊天最后,薄列峰还给大家推荐了一个EMO的私房玩法:V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

可以试试拿自己5岁、10岁、15岁……的照片,自己对话,自己合唱。V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得一试哟~V8Z速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩http://www.sushuapos.com/show-2-5685-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 58行代码把Llama 3扩展到100万上下文,任何微调版都适用

下一篇: 首选窗口瞄准17时27分 嫦娥六号任务今日发射

热门资讯

  • 量子计算机能更好解决组合优化问题

    旅行推销员问题是一个经典的数学问题,也是一个组合优化问题。德国柏林弗雷大学和亥姆霍兹柏林能源与材料研究中心(HZB)科学家开展的一项新研究证明,量

  • AI领域,重磅消息传来!

    AI领域,一则重磅消息传来!最新消息,全球最知名的AI公司——OpenAI将在几个月内发布新版大型语言模型GPT-5,性能将有大幅跃升。目前,ChatGPT使用

  • 感染新冠会“导致智商下降”吗?

    据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生

  • 探月工程四期鹊桥二号中继星成功发射

    3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后,星箭分离,将鹊桥二号中继星

  • 培生2023年财报业绩超出预期,持续加码数字产品

    21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基

  • 雌蛙会向雄蛙“暗送秋波”?这项研究给出了答案

    记者3月21日从安徽师范大学获悉,该校生命科学学院张方教授课题组通过野外自然抱对、控制实验下抱对以及视频回放等实验手段,证实他们前期提出的,眨眼

  • 世界睡眠日:别让你的良好睡眠被手机夺走

    再打一局游戏就睡,再刷几个视频就睡,终于放下手机,关灯睡觉了……结果翻来覆去睡不着,半夜醒来再也睡不着,为什么明明睡着了,睡眠质量却不高

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 我国网民规模达10.92亿人:互联网普及率77.5%!

    3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12

  • iPhone可能在国内设备使用百度AI技术:集成于iOS 18

    有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权

  • 中广核:用创新技术提升核电站“智”力

    在近日开幕的中国国际核工业展览会上,中国核学会理事会党委书记、理事长王寿君表示,中国内地现有在运核电机组55台、居全球第三;在建核电机组26台,保持

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

推荐资讯

  • 日榜
  • 周榜
  • 月榜