设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

揭秘Sora:开发团队成立不到1年,核心成员含多位华人

发布时间: 2024-02-21 09:11:45 来源:

  揭秘Sora:开发团队成立不到1年,核心成员包含多位华人O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

每经记者 文巧 O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊叹,一时间,诸如“现实不存在了”的评论在全网刷屏。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破――Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队之一。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间尚未超过1年。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  创新“站在谷歌肩上”O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术――DiT架构和Spacetime Patch(时空Patch)。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据外媒报道,Spacetime Patch是Sora创新的核心之一,该 项 技 术 是 建 立 在 谷 歌DeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇论文是由谷歌DeepMind的科学家们于2023年7月发表的。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  相关论文曾遭拒绝O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道:“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  开发团队还有“00后”O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在谷歌和英伟达就职。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  团队成员中甚至还有“00后”。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,团队还有几位华人。据媒体报道,Li Jing是DALL-E 3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。O7r速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  刚被罚款3.55亿美元后 特朗普“带货”球鞋  中新网2月19日电 据美联社消息,当地时间17日,美国前总统特朗普在一场商业活动中带货了一双“特朗普”牌的金色球鞋,引发热议。  据报道,特朗普当天在费城会议中心举行   中新经纬2月19日电 据《华尔街日报》中文网19日报道,欧洲监管机构将对苹果公司(Apple Inc., AAPL)处以超过5亿美元的罚款,理由是这家科技巨头不公平的阻碍了其他音乐流媒体竞争对手。  《华尔街日报》中文网援引 今天《中国电子报》刊登西北工业大学校长、中国工程院院士宋保维署名文章《发挥教育科技人才优势 为建设制造强国贡献高校力量》现将文章登载如下,以飨读者。制造业是国家经济命脉所系,是立国之本、 检察题材电影《第二十条》春节档全国热映,艺术地诠释了“法不能向不法让步”的司法理念,受到社会各界的广泛关注。最高检微信公众号即日起开设“你评我说·检察官看《第二十条》”专栏,邀请检察人员   中新经纬2月22日电 据高检网22日消息,近日,中国铁路青藏集团有限公司原党委委员、职工董事、副总经理、工会主席贾军(副厅级)涉嫌受贿罪、行贿罪一案,经最高人民检察院指定管辖,由甘肃省庆阳市人民检察院依法向甘肃省 。

本文链接:揭秘Sora:开发团队成立不到1年,核心成员含多位华人http://www.sushuapos.com/show-5-6758-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 创历史新高 民航春节假期运客1799.2万人次

下一篇: 中国内地中小企业投资AI技术意愿全球最强

热门资讯

  • “极严重灾害”!日本能登地区地震已致213人遇难

      “极严重灾害”!日本能登地区地震已致213人遇难  中新网1月11日电 综合日媒报道,日本石川县11日公布的最新统计数据显示,能登地区地震已致213人死亡、52人下落不明。  

  • 快问|裁员40%?资生堂中国回应

      中新经纬1月11日电 (林琬斯)近日,有传闻称资生堂中国裁员40%。11日,资生堂中国回应中新经纬称,相关传言与事实不符。  资生堂中国表示,资生堂中国于2024年开始实施新的品

  • 人社部:整治虚假职业技能培训

      人社部:整治虚假职业技能培训  人社部近日发布通知,要求规范培训机构办学,严禁以招生费等名义直接或变相买卖符合补贴条件的生源,以联合办学、培训合作等名义违规转包政府

  • 龙年首场寒潮来袭,多地高速、列车受影响

      中新经纬2月18日电 龙年首场寒潮来袭,雨雪、大风、沙尘暴齐袭,多地高速受影响堵车或暂时封闭、列车停运。  中央气象台18日晨将寒潮预警提升至橙色,这也是寒潮预警的最高

  • 天津重点监测商贸企业春节假期销售额同比增11.2%

      锦绣中国年 | 天津重点监测商贸企业春节假期销售额同比增11.2%  中新网天津2月18日电 (记者 王君妍 通讯员 王 张欣悦)今年春节假期为期8天,是一个“超级假期”,消费市

  • 龙年春节档的卖相与怪相

      龙年春节档的卖相与怪相  龙年春节档迎来尾声。回望春节前夕,无超级大片,多数影片都是熟面孔且不举行首映,观众进影院如开盲盒。以“贾玲减重100斤”为首的各种营销策略

  • 甘肃礼县:“点对点”输送务工人员返岗复工

    中国经济导报 中国发展网讯 春风送暖促就业、精准服务助发展。2月21日,甘肃礼县举行2024年春风行动·东西部劳务协作招聘会暨“礼贤妹”“礼贤大嫂”

  • 新一轮雨雪冰冻天气来袭 湖南积极备战保民生

    新华社记者周楠、余春生、谢奔“路上快要结冰了,开车要注意安全。”2月21日中午,在省道S306茶垭段,寒风瑟瑟,湖南省桑植县竹叶坪乡政府工作人员李雅敏正和同事

  • “一年卖了20万条马面裙,布料都不够了”

      中新经纬2月23日电 (周奕航)“和以往相比,今年的订单量足足翻了四五倍。”山东省菏泽市曹县的汉服加工厂老板陆平(化名)对中新经纬表示。  这个春节,马面裙火了。许多年

  • 大叔追“鸟”、小伙爱“骆驼”,北面户外业务“群狼环伺”

      大叔追“鸟”、小伙爱“骆驼”,北面户外业务“群狼环伺”  王涵艺  近日,威富集团(VFC.N)发布2024财年第三季度财报(截至2023年12月30日的三个月内),集团收入同比下滑1

  • “奥德修斯”着陆!时隔50多年美国航天器首次登月

      “奥德修斯”着陆!时隔50多年美国航天器首次登月  中新网2月23日电 综合美媒报道,当地时间22日,美国“直觉机器”公司研发的月球着陆器“奥德修斯”在月球着陆。  美国

  • 京津冀以就业服务协同激发区域就业新活力

      京津冀以就业服务协同激发区域就业新活力  中新网北京2月22日电 (记者 杜燕)在京津冀协同发展战略实施十周年之际,京津冀三地人社部门22日在北京城市副中心三大建筑之

推荐资讯

  • 千味央厨:2023年实现营收19.01亿元,同比增长27.69%

    4月28日,千味央厨披露2023年年度报告。2023年,公司实现营业收入19.01亿元,同比增长27.69%;归母净利润为1.34亿元,同比增长31.43%。其中2023年因股权激励产生的费用为1791.08万元,

  • 苏北首家voco酒店—海州湾voco酒店开业

    扬子晚报消息,近日,洲际酒店集团旗下品牌——voco酒店在连云区开门迎客。据悉,海州湾voco酒店是苏北的首家voco酒店,酒店位于东部城区CBD商务中心黄金地带,周边聚集了在海一方公

  • 首旅酒店:2024第一季度营收18.45亿元,净利润同比增长49.83%

    4月28日,北京首旅酒店(集团)股份有限公司发布了2024年第一季度报告。报告显示,首旅酒店在报告期内实现了营业收入18.45亿元,同比增长11.47%;归属于上市公司股东的净利润达到1.21亿

  • 小红书正进行新一轮估值200亿美元融资

      4月29日,据IPO早知道公众号消息,小红书正在进行新一轮估值200亿美元的融资。接近本轮融资的投资人透露,本轮融资实则就是小红书的Pre-IPO轮融资,将为小红书潜在的IPO作一定

  • 酒店业复苏:四大酒店重新洗牌,房价提升能否持续?丨文旅年报观察⑤

    21世纪经济报道记者 张赛男 实习生黄宏韬 上海报道“五一”假期临近,酒店市场重新点燃。来自携程的数据显示,“五一”期间,境内酒店搜索热度

  • 福建平潭“蓝眼泪”爆红,县城住宿预订量同比增长176%

    来自美团的数据显示,近一月来“蓝眼泪”相关关键词搜索量较去年同期增长123.4%。从平台文旅消费预订数据看,今年“五一”假期期间,平潭县游客规模将在福州市各区县中排名第一位

  • 青岛鲲鹏主题乐园将于“五一”期间对外开放

      近日,据了解,由海控集团投资建设的青岛鲲鹏主题乐园将于“五一”期间正式对外开放。  该项目位于青岛红树林度假世界园区内,占地面积约15000㎡。鲲鹏主题乐园以自然、互

  • 如此朴素,如此节制

    《孔秀》是导演王超的第九部电影,也是王超第一次改编他人的作品。这部影片改编自作家张秀珍的半自传小说《梦》,讲述了20世纪60年代到80年代,一位名叫

  • 自然资源部:继续大力保障保障性住房用地供应

      近日,据自然资源部消息,为适应房地产市场供求关系发生重大变化的新形势,支持盘活存量土地,促进房地产市场平稳健康发展,自然资源部下发通知,要求各地做好年度住宅用地供应计划

  • 沙特首家艾迪逊酒店揭幕

    近日,沙特首家艾迪逊品牌酒店——吉达艾迪逊酒店全新揭幕。酒店拥有52间客房和11间套房,包括两间顶层公寓、一个带游泳池的屋顶露台、水疗中心、健身房,以及两个休息室和一间招

  • 时间与桑皮纸 亦敌亦友

    夜已深,窗外未静。寄居近处,灯火通明,南北向的一条马路,车流不息属常态。喇叭声时起,烧烤味不时飘来,兼有婴儿啼哭声、家长督学的呵斥声。所谓写作,只能见

  • 乌鲁木齐白鸟湖片区保租房项目计划年底建成

      5月7日消息,位于乌鲁木齐市经开区(头屯河区)白鸟湖片区的保障性租赁住房项目在火热建设中。今年年底建成后,将辐射该辖区近5000人生活配套服务。  乌鲁木齐一号台地工业

  • 日榜
  • 周榜
  • 月榜