设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元文生图大模型全面开源

发布时间: 来源: 科技日报

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。5WR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月20日对于我国抗衰老研究是个特殊的日子,经过近3年的不懈努力,八子补肾胶囊抗衰老取得又一重大突破。挑战人类生命极限是摆在全球科学家面前的重大课题,抗衰老研究已成为世界生命科学领域关注 美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许多国家蛋白质消费极大比例的全球性行为,但捕 3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰富的AI解决方案。据悉,借助大模型等生成式AI 3月23日消息,据最新爆料,vivo X100s Pro已经获得3C认证,估计 会在5月份前后发布。该机可以看做是vivo X100 Pro的小迭代机型,属于半代升级款,与去年X90s类似。新机从此前的天玑9300升级为天玑9300+,处 3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门航天卫星应用领域商业化、产业化发展更进一 在近日开幕的中国国际核工业展览会上,中国核学会理事会党委书记、理事长王寿君表示,中国内地现有在运核电机组55台、居全球第三;在建核电机组26台,保持全球第一。这些成绩的取得,离不开智能化技术 。

本文链接:腾讯混元文生图大模型全面开源http://www.sushuapos.com/show-2-6308-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 山西大学团队用图调控网络 实现高性能点云分割

下一篇: 具身智能:步入AI舞台中央?

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜