记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。
这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。
腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。
过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。
记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。
评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。
目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。
混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。
“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。
此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。
记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。
这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。
腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。
过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。
记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。
评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。
目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。
混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。
“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。
此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。
肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团队首次证明,EGFR的一个关键界面可能会成为更 “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源管理司副司长张鸿星21日接受科技日报记者采 自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应用。不少网友在社交媒体上晒出了与自己“AI 21世纪经济报道记者雷晨 北京报道近日,国内AI领域的明星产品——Kimi智能助手,因流量激增遭遇了短暂的服务中断。月之暗面随后发布公告,对此次服务中断事件进行了说明,并采取了一系列紧 中国气象局下一代大气数值模式日前发布。该模式采用完全自主的动力框架算法——多矩约束有限体积方法为基础算法,进一步提升全球公里级和区域百米级尺度数值预报的精度,显著减小全球 近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空 。本文链接:腾讯混元文生图大模型全面开源http://www.sushuapos.com/show-2-6308-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
下一篇: 具身智能:步入AI舞台中央?