直接生成16秒高清视频我国自研视频大模型在京发布

发布时间: 2024-04-28 08:53:17 来源：

观看：183

只需一段文字指令就能生成一段逼真视频，今年初，文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

记者从会上获悉，这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容，不仅能模拟真实物理世界，还拥有丰富想象力。

清华大学人工智能研究院副院长、生数科技首席科学家朱军说，当前国内视频大模型的生成视频时长大多为4秒左右，Vidu则可实现一次性生成16秒的视频时长。同时，视频画面能保持连贯流畅，随着镜头移动，人物和场景在时间、空间中能保持高一致性。

在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换，包括能直接生成长镜头、追焦、转场等效果。

“Vidu能模拟真实物理世界，生成细节复杂且符合物理规律的场景，例如合理的光影效果、细腻的人物表情等，还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍，由于采用“一步到位”的生成方式，视频片段从头到尾连续生成，没有明显的插帧现象。

此外，Vidu还可生成如熊猫、龙等形象。

据悉，Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累，其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型，我们相信，Vidu未来能支持生成更加多样化、更长时长的视频内容，探索不同的生成任务，其灵活架构也将兼容更广泛的模态，进一步拓展多模态通用能力的边界。”朱军说。

（来源：新华社记者：魏梦佳）

王林，2019年初的时候在阜阳开了一个早餐店，店铺小，所以就他和他老婆两个人一起打理，一年的时间生意有了起色，但是好景不长，2019年底的时候新冠肺炎疫情开始出现，到2020年初开始全国性的封控，他们的早餐店关门因恒生综合大型股指数、中型股指数、小型股指数实施成份股调整，根据《上海证券交易所沪港通业务实施办法》、《深圳证券交易所深港通业务实施办法》的有关规定，新一轮港股通标的证券名单发生调整，并于20 为期40天的春运3月5日结束。记者从交通运输部获悉，2024年春运40天全社会跨区域人员流动量预计超84亿人次。其中，铁路客运量预计完成4.8亿人次；公路人员流动量预计完成78.3亿人次，其中高在娱乐圈中，有许多明星都是在转行后取得了巨大成功。其中，周深、毛不易、杨千嬅、许嵩和徐佳莹这五位歌坛明星，原本是医护人员，但在转行后展现出了惊人的才华和实力。首先，我们来看看周深的故事。周深原本是一名牙医，但由于近日,德国VEVA(韦瓦)公司在深圳投资8800万人民币,宣布设立技术中心,此举在净水器行业掀起不小的波澜。这一重大决策不仅彰显了韦瓦在净水技术领域的领先地位,也预示着其在全球市场的进一步扩张。作为 ——代表委员建言推动港澳更好融入国家发展大局据新华社电 “大湾区‘一小时生活圈’已成现实，内地与港澳居民双向奔赴令人欣喜”“我们要发挥好桥梁作用，把中央声音传递到港澳，把港澳心声带到中央”“港澳要保持繁荣稳。

本文链接：直接生成16秒高清视频我国自研视频大模型在京发布http://www.sushuapos.com/show-1-11925-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：重庆九龙坡：打造“一刻钟便民生活圈”的城市范例

下一篇：南财早新闻｜规上工业企业利润连续三个季度增长；中国科幻产业总营收首破千亿元

直接生成16秒高清视频我国自研视频大模型在京发布

热门资讯

推荐资讯

快讯最热文章

直接生成16秒高清视频 我国自研视频大模型在京发布

热门资讯

推荐资讯

快讯最热文章

直接生成16秒高清视频我国自研视频大模型在京发布