设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

发布时间: 来源: 量子位

不做大而全,专注垂直场景8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

编辑部 整理自 AIGC峰会8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAI8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全球AIGC应用浪潮下,怎样将大模型产品以一种更贴近消费者的形式融入生产力工具?8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这,或许是AI在生产力场景延伸过程中,入场玩家们所要思考的一个重要问题。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国AIGC产业峰会上,美图公司创始人、董事长兼CEO吴欣鸿从美图视频大模型的探索之路出发,讲述了美图在图像、视频和设计领域深耕16年而获得的经验与感悟以及对未来的预判。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

为了完整体现吴欣鸿的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

话题要点

  • AI加持,只用半天,就能做出时长60秒的惊艳短片
  • 面对越来越激烈的竞争,创意超越现实、工作流的整合、垂直场景能力这三点非常关键
  • 垂直模型的创新,有两年左右的窗口期
  • 美图不做大而全的模型和场景,更关注垂直的图像和视频模型及场景

以下为吴欣鸿演讲全文:8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图视频大模型的探索之路

一眨眼,美图已成立16年。最早,我们做影像工具,像美图秀秀。此外很长一段时间,美图也探索了不同业务,踩了很多坑。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从2021年开始,我们基于订阅的商业模式,取得了非常好的经营状态,并重新聚焦于影像和设计产品。现在,我们已经从过去的工具自卑转变成越来越有信心。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们正逐步往生产力场景延伸,从最初的拍摄、修图、修视频、社交分享到现在新增的视觉创作、专业摄影、专业视频编辑、商业设计等等。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图现在拥有了影像与设计产品全家桶。产品主要分为AI图像、视频和设计三个大类。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,在生态层,美图今年初收购了站酷,为我们提供了优秀的设计师共创、商用版权销售和专业课程设计等服务。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

模型层,去年6月发布的美图奇想大模型为我们以上产品提供了强大的模型能力支撑。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

前两天,我们使用美图生产力全家桶制作了一部短片。我想邀请大家观看这个一分钟的短片。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

谢谢大家观看。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我想重点介绍这个60秒的短片是怎么制作出来的。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其实只用半天时间,就能做出同样惊艳的效果。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

前期制作中,我们使用了开拍AI脚本以及美图WHEE进行风格和角色的一次性约束,确保短片中人物形象和画面风格的一致性。同时,我们还使用WHEE的文生图进行了关键的分镜设计。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中期制作阶段,同样是美图WHEE,我们将这些分镜制作成视频化,相当于图生视频。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,我们还使用美图开拍的AI数字人进行了输入对话、唇形同步。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

后期制作环节,我们使用了美图的Wink进行视频编辑,并制作了自动字幕和添加音效。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所有这些产品都是由美图奇想大模型驱动的,与AI紧密相关。这展示了AI原生工作流的有益探索,与传统动画工作流相比,效率得到了很大提升,且门槛大幅降低。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

朝着Diffusion Transformer架构进化

去年12月,我们发布了MiracleVision 4.0版本,其中重点是AI视频和AI设计能力。刚才的视频就是使用去年12月的视频大模型生成的。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,这和最近我们正在训练的美图视频大模型2.0在能力上还有很大区别,我简要介绍一下进化的方向。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最早,我们采用了U-Net结构,在编码部分也只能进行空间域压缩。Sora发布后,我们发现在架构上有很多可以参考学习的地方,因此我们升级了视频大模型的架构,采用了Transformer结构,另外还实现了时空域同步压缩。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

美图视频大模型目前正在从1.0向2.0的跨越,实现全方位的技术升级,模型参数量显著增大,同时将拥有更加强大的语义理解能力,大幅提升视频生成时长、稳定性与内容一致性。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上述的视频大模型2.0将于今年6月美图影像节正式亮相。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

垂直模型创新有两年左右窗口期

我们对未来也有一些预判。现在大家都在追赶Sora,预计今年下半年将会有很多国产Sora扎堆上市。美图的MiracleVision也是其中一家。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们认为,面对越来越激烈的竞争,有三个点非常关键。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第一,创意超越现实8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

众所周知,Sora拥有许多充满创意、奇思妙想的画面,这是实拍很难做到的。同时,如果将这些画面采用传统的视频特效方式制作,成本将非常高昂。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们认为,视频大模型应与实拍相辅相成,生成一些超越现实的创意画面,成为一种全新的特效制作方式。以前的特效,比如前期做绿幕、后期要做动捕等等,时间长、成本高,而现在AI特效可以做到低成本、低门槛。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第二,工作流的整合8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果只是单纯拼生成能力,比如文生视频,其实它的应用场景是相对有限的。我们正将美图现有的生产力工具能力进行整合,无论是AI能力还是传统视频技术相结合,形成类似刚才60秒短片的动画制作工作流。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第三,垂直场景的能力8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们也在探索视频大模型未来能否在电商、广告、游戏、动漫、影视等场景进行深度应用和变现。因此,垂直场景的可用性同样是竞争的关键。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于垂直创新模型的创新,我们认为有两年左右的窗口期。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这里,我们对自己业务的要求是,不去做大而全的模型和场景,更关注垂直的图像和视频模型,以及电商、广告等垂直场景。同时,我们也将不断探索AI原生工作流,我们认为它是一种更能降本增效的实现方式。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

刚才提到,文生视频将是视频大模型的标配,同时还有更多的视频生成方式,如图生视频、视频生视频、音频生视频等。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

我们可以看到,无论是哪种视频生成方式,都将有广阔的应用场景。例如,图生视频,因为美图是从图片工具发展起来的,我们每天会产生两亿多张图片,如何让图片动起来?例如,美颜相机的AI写真就在探索AI视频写真,我认为这是一种更贴近消费者的形式。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

视频生视频,我们可以理解为一种全新的视频渲染方式,视频风格化方式。音频生视频,我们现在在探索MV的生成,同样也是一个有趣的领域。同时,开拍的AI主播也可以用音频生成,我们录一段音就可以生成AI主播完整的口播视频。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这块,我们也对未来进行了预判。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会

去年,当然是视频大模型的早期阶段,我们去年12月发布的模型,基本上只能生成3-5秒的视频片段,世界、动作一致性和稳定性都较差。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今年2月,Sora的横空出世,我们看到确实有些对物理世界的理解,包括在创意、特效上有一定涌现的现象,视频的时长也显著提升。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们也期待在明年,甚至更远的未来,视频大模型能够实现更深度的物理理解,拥有剧情设计、分镜、转场等更专业的能力,能够与视频制作工作流紧密结合。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也希望大家关注6月的美图影像节。除了全新的视频大模型,我们还将有一系列生产力工具全家桶陆续亮相。8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今天我就分享到这,谢谢大家!8zO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月19日,记者从香港科技大学获悉,该校以人工智能生成式工具设计出10位“AI讲师”, 这些“AI讲师”来自世界各地,属不同民族及文化背景。该校希望通过创新教学模式,激发学生学习热情,提升课堂参与度   AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨头也低调实现了稳健的成长性。  据Gartne 3月22日消息,一加Ace 3V昨晚发布,起售价1999元,将于3月25日正式发售。现在这款新机已经来到我们评测室,下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙7+移动平台,采用骁龙8 Gen3相同的4nm制程工 据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出租车在2030年广泛使用铺平道路。尽管在最初 随着无人驾驶技术的快速发展,无人车在城市配送、环卫清扫、安防巡逻等应用场景中已得到较好示范应用。3月22日,南京溧水经济开发区管委会与南京易咖智车科技有限公司联合举办“金陵智地 易启未 为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科学技术协会(以下简称“北京市科协”)在北京科 。

本文链接:美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会http://www.sushuapos.com/show-2-5646-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%

下一篇: 奥特曼承认了神秘gpt2!哈佛MIT巡演继续,斯坦福演讲完整版公开

热门资讯

  • 未来,政企深度用云需要一朵怎样的“云”?

    随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业

  • 马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

      马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然

  • 人工智能医疗或将破解人体秘密

    美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 日学者提出“深海激励化学”新概念

    日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温

  • 阿尔茨海默病早期症状可能表现在视力上

    据阿根廷布宜诺斯艾利斯经济新闻网报道,一项国际研究发现,阿尔茨海默病的早期症状可能表现在视力上。研究显示,即便眼科检查结果正常,但阅读、估计距离

  • 肺癌蛋白质致命弱点发现

    肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团

  • 黑场显微镜让单个颗粒实现无标记光学显微成像

    3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • 苹果 16首发预装!iOS 18将支持桌面自定义、引入大模型

    3月25日消息,按照惯例,iPhone会在6月份的WWDC上发布iOS 18、watchOS 11、visionOS 2等全新系统。其中iOS 18比较受关注,被许多爆料者称为iOS史上最大升级

  • 首批未来产业创新成果惊艳亮相

    全球首台无细胞蛋白质合成生物反应器、全球首台全高温超导托卡马克装置(洪荒70)、64比特超导量子计算机研发与产业化项目、深海可燃冰探采重载作业机

推荐资讯

  • 日榜
  • 周榜
  • 月榜