直接生成16秒高清视频我国自研视频大模型在京发布

发布时间: 2024-04-28 08:53:20 来源：

观看：305

只需一段文字指令就能生成一段逼真视频，今年初，文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

记者从会上获悉，这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容，不仅能模拟真实物理世界，还拥有丰富想象力。

清华大学人工智能研究院副院长、生数科技首席科学家朱军说，当前国内视频大模型的生成视频时长大多为4秒左右，Vidu则可实现一次性生成16秒的视频时长。同时，视频画面能保持连贯流畅，随着镜头移动，人物和场景在时间、空间中能保持高一致性。

在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换，包括能直接生成长镜头、追焦、转场等效果。

“Vidu能模拟真实物理世界，生成细节复杂且符合物理规律的场景，例如合理的光影效果、细腻的人物表情等，还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍，由于采用“一步到位”的生成方式，视频片段从头到尾连续生成，没有明显的插帧现象。

此外，Vidu还可生成如熊猫、龙等形象。

据悉，Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累，其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型，我们相信，Vidu未来能支持生成更加多样化、更长时长的视频内容，探索不同的生成任务，其灵活架构也将兼容更广泛的模态，进一步拓展多模态通用能力的边界。”朱军说。

（来源：新华社记者：魏梦佳）

21世纪经济报道记者钟雨欣郑雪北京报道民营经济已经成为推动我国发展不可或缺的力量，成为创业就业的主要领域、技术创新的重要主体、国家税收的重要来源，在我国经济发展中发挥着重 21世纪经济报道记者李德尚玉北京报道 3月5日，国务院总理李强在政府工作报告中提出，要加强生态文明建设，推进绿色低碳发展。深入践行绿水青山就是金山银山的理念，协同推进降碳、减污、 3月6日，十四届全国人大二次会议于3月6日下午3时举行记者会。商务部部长王文涛在记者会上表示，今年要推动汽车、家电、家装等消费品以旧换新，还要提振服务消费。王文涛提及，今年促消费有两个重点：一个是推动消费品以旧 21世纪经济报道记者吴文汐北京报道 “三峡门户”宜昌地处长江经济带重要节点，是湖北省域副中心城市，也是长江中游城市群中的重要成员。2023年，宜昌实现经济增速7.1%，居湖北全省前列；经 3 月 9 日消息，数码评测频道 JerryRigEverything 在最新一期视频中，使用不同口径、不同的武器，专门评测了特斯拉 Cybertruck 纯电皮卡的防弹性能。此前报道，马斯克给出了更具体的解释：“车门板对几乎所有亚音速子南方财经全媒体记者郑康喜东莞报道今年的政府工作报告提出，要积极扩大有效投资。发挥好政府投资的带动放大效应，重点支持科技创新、新型基础设施、节能减排降碳，加快实施“十四五”规。

本文链接：直接生成16秒高清视频我国自研视频大模型在京发布http://www.sushuapos.com/show-4-5946-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：长安启源 A07 正式推送启源 OS 1.0 版本：新增车外音控、AI 对话、导航分屏等功能

下一篇：南财早新闻｜规上工业企业利润连续三个季度增长；中国科幻产业总营收首破千亿元

直接生成16秒高清视频我国自研视频大模型在京发布

热门资讯

推荐资讯

汽车最热文章

直接生成16秒高清视频 我国自研视频大模型在京发布

热门资讯

推荐资讯

汽车最热文章

直接生成16秒高清视频我国自研视频大模型在京发布