设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

揭秘Sora:开发团队成立不到1年,核心成员含多位华人

发布时间: 来源:

  揭秘Sora:开发团队成立不到1年,核心成员包含多位华人izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

每经记者 文巧 izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊叹,一时间,诸如“现实不存在了”的评论在全网刷屏。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破――Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队之一。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间尚未超过1年。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  创新“站在谷歌肩上”izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术――DiT架构和Spacetime Patch(时空Patch)。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据外媒报道,Spacetime Patch是Sora创新的核心之一,该 项 技 术 是 建 立 在 谷 歌DeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇论文是由谷歌DeepMind的科学家们于2023年7月发表的。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  相关论文曾遭拒绝izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道:“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  开发团队还有“00后”izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在谷歌和英伟达就职。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  团队成员中甚至还有“00后”。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,团队还有几位华人。据媒体报道,Li Jing是DALL-E 3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。izH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  买买买!去年中国奢侈品市场达到6077亿元,约占全球22%   中国消费者“点燃”奢侈品市场  羊城晚报记者 陈泽云  中国人“买买买”奢侈品的热情和实力又回归了!  近日,全球最大奢侈品巨头LVMH发布了2023年全年 新华社记者付敏、姚雨璘在寸土寸金的厦门岛市区,面积约3公顷的骑马山片区保护区隐匿在林立的高楼大厦中。该保护区设置于2011年,是厦门五缘湾栗喉蜂虎市级自然保护区的重要组成部分——一种 一年之计在于春。2月20日,湖北省天门市委书记、市人大常委会主任纪道清调研工业经济“开门红”工作。他强调,要牢牢把握高质量发展这个首要任务,把稳增长放在更加突出位置,铆足干劲,奋力夺取一季度“开门   我跨境电商占韩海外直购市场近半份额  作者 杨明  凭借“高性价比”和“低物流费”等优势,中国跨境电商企业已占据韩国海外直购市场的近一半份额,本地化服务的提升也是中国企业在韩国快速扩张的重要原因。过去   “十四五”前三年江西省单位工业增加值能耗预计下降约8%  中新网南昌2月22日电 (朱莹)22日,江西贯彻实施《江西省人民代表大会关于全力打造国家生态文明建设高地的决定》(以下简称《决定》)座谈会在南昌召开。记   中新经纬2月22日电 据高检网22日消息,近日,中国铁路青藏集团有限公司原党委委员、职工董事、副总经理、工会主席贾军(副厅级)涉嫌受贿罪、行贿罪一案,经最高人民检察院指定管辖,由甘肃省庆阳市人民检察院依法向甘肃省 。

本文链接:揭秘Sora:开发团队成立不到1年,核心成员含多位华人http://www.sushuapos.com/show-5-6758-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 创历史新高 民航春节假期运客1799.2万人次

下一篇: 中国内地中小企业投资AI技术意愿全球最强

热门资讯

推荐资讯

  • 大悦城:2023年酒店收入9.70亿元,同比增长75.14%

    近日,大悦城发布了2023年年报。报告显示,2023年,大悦城在巩固现有住宅与商业优势的基础上,通过“轻重并举”的发展策略,持续扩大购物中心、写字楼与产业地产、酒店、长租公寓等经

  • 首旅酒店:2024第一季度营收18.45亿元,净利润同比增长49.83%

    4月28日,北京首旅酒店(集团)股份有限公司发布了2024年第一季度报告。报告显示,首旅酒店在报告期内实现了营业收入18.45亿元,同比增长11.47%;归属于上市公司股东的净利润达到1.21亿

  • 四川多个景区官宣免门票优惠政策

      “五一”假期即将到来。近期,四川多个景区官宣了“劳模”免票政策.    九寨沟景区  2024年5月1日至5月5日,对持有地市州及以上人民政府颁发的“劳动模范”证书、政

  • 河北邯郸市推进大型旅游景区消费维权服务站全覆盖

      近日,河北省邯郸市市场监管局印发《关于进一步加强全市旅游景区消费维权服务站规范化建设的通知》,大力推进旅游景区消费维权服务站规范化建设,进一步畅通消费维权渠道。 

  • 作为美食家的大仲马

    在西方,法国19世纪“积极浪漫主义”作家大仲马(Alexandre Dumas),也许是唯一一位靠通俗文学跻身大文豪之列的作家。从1828年大仲马用业余时间撰写的剧

  • 张家界旅游集团2024年一季度营收5861.47万元

      4月29日,张家界旅游集团发布2024年第一季度财报。财报显示,张家界旅游集团2024年一季度实现营业收入5861.47万元,同比下降8.48%;归属于上市公司股东的净利润亏损4648.19万

  • 喜来登酒店签约入驻重庆大渡口

    近日,重庆潜能实业集团与万豪国际集团合作签约仪式举行,双方将携手在大渡口打造重庆潜能喜来登酒店。该酒店项目是大渡口区完善城市功能、提升城市品质的重点项目,也是大渡口区

  • 网络文学与评论有效互动,造就时代文学新景观

    网络文学正处在转型升级、迭代发展的进程中,不同类型的网络作家以不同的想象方式与叙事模式,生发网络文学的新变,在国内和海外不断拓展着网络文学影响

  • 五一期间西藏酒店预订热度与去年同比增长65%

    5月6日,同程旅行发布《2024“五一”假期西藏酒店预订热度报告》数据显示,2024“五一”假期期间,西藏旅游市场延续火爆态势,酒店预订热度与去年同比增长65%,其中,拉萨酒店预订热度

  • 陈晓卿出书讲述如何“吃透”人生

    “美食的终极意义在于获得生理和心理的幸福感。这种幸福感是非常主观的,有时候和食物本身相关,有时候和生活经历相关,吃家常菜得到的满足感,吃燕鲍翅并

  • 金恪集团旗下多家度假酒店五一期间连续3天满房率100%

    滨州网消息,5月6日,金恪集团旗下度假酒店五一黄金周期间业绩报告出炉,多项指标增长率均创新高。5月1日-5日,集团旗下太仓艳阳度假酒店、桐庐溢美国际酒店、乌镇宜何度假·梵璞主

  • 乌鲁木齐白鸟湖片区保租房项目计划年底建成

      5月7日消息,位于乌鲁木齐市经开区(头屯河区)白鸟湖片区的保障性租赁住房项目在火热建设中。今年年底建成后,将辐射该辖区近5000人生活配套服务。  乌鲁木齐一号台地工业

  • 日榜
  • 周榜
  • 月榜