人工智能在去年给人类带来巨大冲击,不少声音指出在创意等方面人类尚无法被其取代。这一想法再次遭到挑战。当地时间2月15日,人工智能巨头,ChatGPT母公司OpenAI宣布,正在研发“文生视频”模型Sora,可创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色,也可以根据静态图像制作动画。根据OpenAI官网,Sora不仅了解用户提出的要求,还了解这些东西在物理世界中的存在方式。
目前,Sora仍在开发中,正在接受安全测试,尚未向公众开放使用。OpenAI CEO奥特曼在社交平台上向公众征集他们想看到的视频,表示公司将制作并发布。
OpenAI CEO奥特曼在社交平台发布Sora视频。
Sora视频一出,立刻震惊业界。此前,其他企业也有类似文本生成视频的AI模型,其中,谷歌正在测试名为Lumiere的模型,Meta则有名为Emu的模型,还有人工智能初创企业Runway也在开发相应产品来帮助制作视频。
针对Sora视频的发布,Runway联合创始人兼首席执行官Cristóbal Valenzuela 回应道,“游戏已经开始”。Runway是一家AI视频公司,几个月前刚刚推出了AI视频模型的第2代更新,并且已可供所有人使用。
人工智能图像生成领域的另一家领导者Stability AI在去年11月推出了生成视频模型Stable Video Diffusion,但表示它“专门用于研究”,尚未准备好用于“现阶段的现实世界或商业应用”(有一个等待名单,但该公司尚未透露何时发布)。
Pika Labs是AI视频领域的新晋竞争者,它于去年11月推出了生成式AI视频工具Pika 1.0,并于去年12月底宣布“等待(名单)已结束”,并向所有人开放。
谷歌最近发布了下一代人工智能模型Gemini 1.5,并公布了Lumiere 模型的研究和演示片段,不过目前还不清楚谷歌计划何时公开该工具,该公司表示需要强大的工具来对抗偏见和恶意内容,确保其技术能够安全部署。
Meta拥有包括Facebook、Instagram和WhatsApp在内的稳定应用程序,并于2022年首次推出了一款名为Make-A-Video的视频生成工具,该工具生成的内容明显虚假、扭曲和模糊,但在当时仍然是一项重大成就。
Meta在去年年底推出了一种新的文本转视频模型Emu Video,并表示几乎所有使用它的人都将其在质量和对文本提示的忠实度方面评为高于“仅仅制作一个视频”(Make-A-Video),在谈到该工具何时发布时,Meta首席执行官马克扎克伯格表示,Emu将被整合到Facebook和Instagram中。
特斯拉CEO埃隆·马斯克的人工智能初创公司xAI希望能够与DeepMind和OpenAI等行业领导者竞争,但尚未宣布文本到视频生成器的计划,尽管这种功能可能会融入到其人工智能聊天机器人 Grok中。
此外,亚马逊已经透露了一款面向工人的生成式人工智能聊天机器人Q和人工智能图像生成器,尽管这家电子商务巨头尚未透露何时计划推出这些工具,也没有透露是否会推出更先进的视频生成器。
NewsGuard的团队已识别出614个不可靠的人工智能生成的新闻和信息网站,涵盖15种语言。其中一些网站每天会生成数百甚至数 当地时间12月17日,美国国家航天航空局(NASA)发表声明称,受不利的天气情况影响,美国国家航天航空局和太空探索技术公司(Spa 关于启动2024年与莫斯科大学互换奖学金、与圣彼得堡大学互换奖学金遴选工作的通知 根据《中国国家留学基金管理委 问:据媒体报道,一名中国留学生在美国犹他州疑似遭遇绑架。中国使馆能否证实此事并介绍情况? 答:中国驻美国大使馆高度重视 科技日报讯 (记者张梦然)美国罗切斯特大学研究人员报告了一种策略,用于了解在具有完全化学复杂性的溶剂中,分子如何失去 据江苏省扬州市职业大学网站消息,扬州市职业大学教学督导室2023年12月28日发布《2023-2024学年第一学期教师及学生座谈 。本文链接:OpenAI首个视频模型发布,竞争者有谁、何时可供使用?http://www.sushuapos.com/show-11-3012-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 湖南大学全国重点实验室+4!