7月24日,爱诗科技正式发布视频生成产品PixVerse V2,全球同步开放,致力用AI视频大模型为每一个用户释放创意可能。
PixVerse V2采用Diffusion+Transformer(DiT)基础架构,并在各方面进行技术创新,提供了更长、更一致、更有趣的视频生成能力。在模型能力提升的同时,PixVerse V2还带来了AI视频生成的全新玩法:在保证一致性的前提下,一次生成多个视频片段,可实现单片段8秒,和多片段40秒的视频生成。
一、以DiT架构为基础,实现多项技术创新
PixVerse V2采用了DiT模型架构,用行业顶尖的模型训练效率实践了视频大模型的Scaling Law,同时在多个方面运用了独创的技术实现了卓越的生成效果。
在时空建模方面,PixVerse V2引入了自研的时空注意力机制,不仅超越了传统的时空分离和 fullseq 架构,而且显著提升了对空间和时间的感知能力,使得在处理复杂场景时表现更为出色。
在文本理解方面,PixVerse V2利用了有更强大理解能力的多模态模型来提取prompt的表征,有效实现了文本信息与视频信息的精准对齐,进一步增强了模型的理解和表达能力。
此外,PixVerse V2在传统flow模型的基础上进行了优化,通过加权损失,促进了模型更快更优的收敛,从而提升整体训练效率。
二、用户第一,提升AI视频创作生产力
基于大量用户反馈和社区讨论,爱诗团队深刻洞察到一致性是AI视频创作的核心挑战,因此,PixVerse V2 在设计和优化上进行了针对性突破:支持一键生成1-5段连续的视频内容,且片段之间会保持主体形象、画面风格和场景元素的一致。这一创新功能,让用户能够围绕特定主题进行高效而便捷的视频创作。
PixVerse V2还支持对生成结果进行二次编辑,通过智能识别内容和自动联想功能,用户可以灵活替换调整视频主体、动作、风格和运镜,进一步丰富创作的可能性。爱诗团队希望在模型性能和美学效果之间寻求平衡,预计未来3个月内还将进行多次迭代升级,提供更好的AI视频生成体验。
PixVerse V2致力让更多用户感受到AI视频创作的乐趣,无论是记录日常脑海中的灵光乍现,还是讲述引人入胜的视频故事,都能变得触手可及。(咸宁新闻网)
国务院总理李强5日在政府工作报告中提出,今年发展主要预期目标是:国内生产总值增长5%左右;城镇新增就业1200万人以上,城镇调查失业率5.5%左右;居民消费价格涨幅3%左右;居民收入增长和经济增长同步;国际收支保持基本平衡;粮食 据新华社电 5日提请审议的政府工作报告提出,坚持以人民为中心的发展思想,履行好保基本、兜底线职责,采取更多惠民生、暖民心举措,扎实推进共同富裕,促进社会和谐稳定,不断增强人民群众的获得感、幸福感、安全感。 今年的政 2024年3月5日,北京玻色量子科技有限公司(以下简称“玻色量子”)与深圳华大生命科学研究院(以下简称“华大研究院”)达成战略合作。此次签约,恰逢十四届全国人大二次会议,李强总理作政府工作报告时提出:在未来 新华社北京3月7日电 7日,中共中央政治局委员、外交部长王毅在十四届全国人大二次会议新闻中心举行记者会。(直播 | 十四届全国人大二次会议举行外交主题记者会) 王毅表示,当前,世界格局正在深刻变革,人类社会遭遇多重挑战 今年是全国人大代表,TCL创始人、董事长李东生连续第22年以全国人大代表身份履职。李东生每年的建议大多围绕科技产业、行业和民生热点等问题展开。今年,他提出了《关于推动中国高清显示产业高质量发展的建议》《关于进 南方财经全媒体记者 翁榕涛 广州报道为贯彻落实国务院关于走访上市公司、推动上市公司高质量发展的工作部署,广东组织开展北交所上市公司系列走访活动,持续加大对优质上市公司支持力度 。本文链接:爱诗科技发布PixVerse V2,更快更长更一致的AI视频生成来了http://www.sushuapos.com/show-1-18871-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。