马斯克奥特曼也都来参加“时装秀”APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
西风 发自 凹非寺APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
量子位 | 公众号 QbitAIAPq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
笑不活,最新虚拟试穿神器被网友们玩坏了。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
黄院士、马斯克、奥特曼、史密斯等一众大佬衣服集体被扒。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
前有老黄卸下皮衣套上糖果包装袋:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

后有奥特曼大秀花臂穿CUCCI:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再有老马变成了蛛蛛侠:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

好莱坞巨星史密斯也风格大变:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但说回研究本身,确实正儿八经的研究。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

名为IDM–VTON,由来自韩国科学技术院和OMNIOUS.AI公司的研究团队基于扩散模型打造。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前官方放出了demo,大伙儿可以试玩,推理代码已开源。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
除了开头所展示的,抱抱脸研究员也玩的不亦乐乎,给老黄换上了专属战袍。其CEO连忙转发打趣:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
我被替代了,没法和他争CEO。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

看热闹的网友也是感慨,经过这么多年,终于不用再担心自己“手残”了(AI帮你搞定)。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

来玩啊~
我们也赶紧上手体验了一把。demo整个页面是这样婶儿的:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

操作起来也是非常简单。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
首先上传人物图,可以手动或者自动选择要修改的区域。然后,上传要换的衣服。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

直接点击Try-on,会自动生成掩模图和换装后的图:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上面这张自动生成的掩模把手也选进去了,所以最后生成的左手效果不好。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
我们手动选取涂抹一下,同时人和衣服全部都用我们自己的图。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


这次效果大伙儿觉得如何?APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
再来展示一波网友的试玩成品图。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
DeepMind联合创始人苏莱曼穿上了微笑面具修格斯联名款T恤:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

甚至不少网友真想要这件衣服。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

奥特曼再次被网友当成模特:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然也有翻车的时候,比如马斯克穿的就是山寨CUCCI。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

看完效果后,接着来看IDM–VTON在技术上是如何实现的。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
基于扩散模型
技术方面,IDM–VTON基于扩散模型,通过设计精细的注意力模块来提高服装图像的一致性,并生成真实的虚拟试穿图像。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
模型架构大概包含三部分:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
- TryonNet:主UNet,处理人物图像。
- IP-Adapter:图像提示适配器,编码服装图像的高级语义。
- GarmentNet:并行UNet,提取服装的低级特征。

在为UNet提供输入时,研究人员将人物图片的含噪声潜在特征、分割掩模、带掩蔽的图片和Densepose数据整合在一起。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
他们还会为服装添加详细描述,例如[V]表示“短袖圆领T恤”。这个描述随后用作GarmentNet(例如,“一张[V]的照片”)和TryonNet(例如,“模特正在穿[V]”)的输入提示。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
TryonNet和GarmentNet产生的中间特征进行了合并,随后传递至自我注意力层。研究人员只使用了来自TryonNet的输出的前半部分。这些输出与文本编码器和IP-Adapter的特征一起,通过交叉注意力层进行融合。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
最终,研究人员对TryonNet和IP-Adapter模块进行了精细调整,并锁定了模型的其它部分。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
实验阶段,他们使用VITON-HD数据集训练模型,并在VITON-HD、DressCode和内部收集的In-the-Wild数据集上进行评估。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
IDM–VTON在定性和定量上都优于先前的方法。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM






IDM-VTON可以生成真实的图像并保留服装的细粒度细节。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更多细节,感兴趣的家人们可以查看原论文。APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
项目链接:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[1]https://idm-vton.github.io/?continueFlag=589fb545dbbb123446456b65a635d849APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://arxiv.org/abs/2403.05139APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://huggingface.co/spaces/yisol/IDM-VTON?continueFlag=589fb545dbbb123446456b65a635d849APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
参考链接:APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[1]https://twitter.com/multimodalart/status/1782508538213933192APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://twitter.com/fffiloni/status/1783158082849108434APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://twitter.com/ClementDelangue/status/1783179067803533577APq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是新质生产力发展的“新引擎”,也是产业和消费
记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为“大规模氢电一体化站关键技术、核心装备及
马斯克开源3140亿参数的Grok,大模型争相开源所为何求? 作者:刘晓洁 特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。 北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140
日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温、高压、黑暗等极限环境。能否从这些极限环
3月22日消息,美国司法部对iPhone提起诉讼,声称其苹果生态系统构成垄断。司法部表示,iPhone将苹果生态系统视为一种垄断,以牺牲消费者、开发者和竞争对手的利益为代价,推动公司估值的飙升。司法部还指
3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介绍,中国知网在人工智能大模型领域的深入研发
。
本文链接:一键换装神器爆火,老黄换上抱抱脸T恤,CEO本人:我被替代了,和他争CEO职位争不过http://www.sushuapos.com/show-2-5481-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 神经元多款车规级芯片重磅来袭 点燃国产“芯”引擎
下一篇: 英特尔发布大型神经拟态系统