设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI语音模型“炸场” 15秒样本即可复刻人声

发布时间: 2024-04-08 08:55:04 来源:

  OpenAI语音模型“炸场” 15秒样本即可复刻人声54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  21世纪经济报道记者孔海丽 实习生牛淑锐 北京报道54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型―Voice Engine公之于众。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  利用文本输入和单个15秒音频样本,Voice Engine就能生成与原说话者非常相似且情感丰富的自然语音。不过,和文本生成视频模型Sora一样,目前OpenAI只针对少部分内测用户开放Voice Engine。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI在其官网披露,2022年底,Voice Engine就被首次开发,并已经用它来支持文本转语音API以及ChatGPT语音和朗读中可用的预设语音。但考虑到合成语音被滥用的潜在风险,OpenAI选择了谨慎有序地推进和发布Voice Engine。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  近两年,全球生成式AI应用规模呈现爆发式增长。据IDC预测,全球AI软件市场规模有望从2022年的640亿美元增长至2027年的2790亿美元,复合增长率为31.4%。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  华泰证券分析师认为,随着基础模型能力优化,多模态应用有望在内容创作、AI教育、虚拟陪伴等场景加速落地。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Voice Engine的问世,解锁了语音模型的更多可能性,例如辅助阅读、视频转译等,也将在发音障碍人群的语言表达上提供有效帮助。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  当AI瞄准声音克隆技术54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  去年,霉霉说地道中文的视频火上微博热搜,而这背后的AI工具来自Voice Engine的采用者之一―AIGC初创公司HeyGen,此话题的阅读量超600万。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  通过Voice Engine进行实时转换翻译,说话者将保留原始口音,原语言不仅能转换成中文、英文、日文等各类语言,也能让面部嘴型完美匹配。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  除此之外,特朗普随口飙一段中文、郭德纲用英语说相声、蔡明阿姨讲段子的视频也在各大社交平台上广为流传。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Voice Engine的官宣也有迹可循。2024年3月19日,OpenAI已经为“Voice Engine”申请了商标,商标的覆盖范围主要是围绕语音识别、语音合成和语音生成等方面。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  谷歌前员工Jonathan Chavez也曾在前段时间透露,OpenAI将在今年推出一款全球最好的个人助理产品,就像钢铁侠中的Jarvis。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  果不其然,Voice Engine如期而至,团队还公示了多场景下的内测结果与相关音频。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  根据OpenAI的介绍,Voice Engine能够通过自然、富有感情的声音为非读者和儿童提供阅读帮助;可以翻译视频和播客等内容,以便创作者和企业可以用自己的声音流利地接触世界各地的更多人;支持非语言人群和帮助患有突发性或退化性言语病症的患者恢复声音。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI语音引擎产品团队成员杰夫・哈里斯 (Jeff Harris)表示,该模型是根据“许可数据和公开数据的组合”进行训练的。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于Voice Engine的进展,网友直呼:“人工智能的发展速度令人兴奋,势不可挡。”54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从业人士认为,Voice Engine将对播客、配音艺术家、口语表演者、有声书和广告解说员、游戏玩家、流媒体主播、客户服务代理、销售人员等众多职业带来现实影响,这其中也包括就业压力。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  大众也期待,当OpenAI的Sora与Voice Engine这两项前沿科技相碰撞,又会擦出什么样的火花,真正意义上的有声AI视频乃至电影短片,是不是也就不远了。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  勒紧“深度伪造”的缰绳54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于Voice Engine技术的使用,除了惊喜与赞叹声,也有人提出了质疑,如果这样的技术用于电信诈骗,后果会很可怕。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有在校大学生告诉21世纪经济报道记者,家长曾接到AI伪造学生声音的诈骗电话。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  其实,OpenAI去年所发布“可以说话”的ChatGPT版本,长期以来一直为各种企业提供根据配音演员的录音所创建的声音,并没有发布从短视频中复制声音的技术。 OpenAI产品经理杰夫・哈里斯(Jeff Harris)表示,以这种方式复制任何声音的能力是有风险的。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2024年2月,美国曾发生利用AI生成语音影响选民投票事件。据报道,在大选之际,新罕布什尔州的部分选民接到一个神秘来电,电话中酷似美国总统拜登的声音号召他们不要在该州初选中投票。后经证实,该来电是机器人语音电话,并非拜登本人录制。此事件在当时引起了不小的轰动,加剧了人们对竞选“深度伪造”的担忧。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为加强语音引擎的安全构建,OpenAI在官方公告中称,公司正在与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴合作,以确保在建设过程中吸收他们的反馈。 不过,OpenAI与这些合作伙伴针对语音引擎的业务进展,需要原始发言者的明确和知情同意,合作伙伴还必须清楚地向观众强调,他们听到的声音是由AI生成的。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI将为AI生成的语音添加水印,以追踪并主动监控其使用方式,以确保其透明度和安全度。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI官方表示:“我们目前不会广泛发布这项技术,仅小部分开放内测,希望语音引擎的这次内测既能强调其潜力,又能增强潜在问题的抵御能力,以应对越来越逼真的生成模型带来的挑战。”54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,他们还将采取一系列安全措施,包括逐步淘汰基于语音的身份验证作为访问银行账户和其他敏感信息的安全措施;探索保护人工智能中个人声音使用的政策;教育公众了解人工智能技术的能力和局限性,包括欺骗性人工智能内容的可能性;加速开发和采用追踪视听内容来源的技术等。54e速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“远方巡视启动!”南方电网云南保山220千伏大寨变电站日前启动首次全套智能巡视,109个摄像头快速旋转,10套在线监测系统开始收集数据,变电站的无人机机巢弹开、无人机飞向工作点位,机器人从卷帘门 记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制。这项研究系统阐明了ASFV感染的细胞嗜性、   马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然不同的选择。3月17日,马斯克宣布开源Grok-1,这 据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生活方式的改变会影响我们的大脑功能。三个月 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键作用。相关论文日前发表于国际生殖领域杂志 。

本文链接:OpenAI语音模型“炸场” 15秒样本即可复刻人声http://www.sushuapos.com/show-2-4631-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 抱抱脸Open了OpenAI的秘密武器,网易参与复现

下一篇: AI有了联想,世界将会怎样?

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜