设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

发布时间: 2024-04-01 14:24:20 来源: 量子位

还帮助病患恢复了声音Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

克雷西 发自 凹非寺Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIDu3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

效果如何?先来听段DEMO:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.
盐分也可以保持人体内的水分,确保其满足正常功能的需要。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI通告显示,他们在2022年底就已经开发出了这项技术,但出于安全考虑一直没有正式发布。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这次,OpenAI终于官宣了Voice Engine,并展示了小规模测试中的几个应用案例。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如,一家非营利医疗机构就利用这项技术,为一名年轻的病人恢复了她的声音。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

另外值得一提的是,去年爆火的视频翻译软件HeyGen,采用的语音引擎也正是Voice Engine。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

那么,这次OpenAI还展现了哪些效果,下面就来一睹为快。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用AI帮助病患恢复声音

首先是利用基础的语音合成能力,为儿童等不具备文字阅读能力的群体提供阅读辅助Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如一家儿童教育技术公司,就一直在使用Voice Engine来给编写好的画外音内容配音。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DEMO中生成的大段内容,都是基于这样一段15秒的样本:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后,就可以合成相同音色的长段语音:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

再来看看HeyGen中用到的的语音翻译技术,原始素材是一段英语的音频:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它被用原始的音色,翻译成了普通话、法语、德语等多种语言。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

忽略译文的质量,只听声音,中文的效果是这样的:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

音色保持的还算不错,不过腔调很明显一听就是外国人在说中文。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

至于这到底是个bug还是个feature,就见仁见智了(手动狗头)。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此外,一款名为Livox的残障人士辅助应用,也利用Voice Engine为不能说话的残障人士“发出声音”——Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在有了Voice Engine之后,TA们可以选择专属的真人音色,而不再是机械感明显的合成音,并且在各种语言之间都能保持音色的一致性。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不只是帮助残障人士拥有自己的声音,Voice Engine还可以为因疾病导致声音发生在重大改变的人群,恢复患病之前声音,只要有以前的声音样本就能实现。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一名年轻的患者因罹患血管性脑肿瘤,失去了流利讲话的能力,说话变成了这样:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本,在Voice Engine的帮助下为她恢复了此前的音色。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此次发布的案例,特别是为不便人士提供帮助的场景受到了不少好评,但也有网友对这项技术的滥用表达了担忧。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

安全问题需要全社会共同关注

实际上,安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

出于安全考虑,前面案例的开发者都经过了OpenAI的严格筛选,并且需要承诺遵守使用协议。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些开发者被要求必须明确说明声音是合成的,并且设定了黑名单以防止克隆公众人物声音。Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,OpenAI还向合成的声音中添加了水印,以便出现问题时可以进行检测监控,同时呼吁人们采取措施共同应对这一问题:Du3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
  • 探索AI时代下个人声音的保护措施
  • 教育公众理解AI的局限性,并了解其被用于欺诈的可能
  • 加速开发跟踪溯源技术,让人们能够清晰辨别出真人和AI
OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

参考链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voicesDu3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

南方财经全媒体记者马嘉璐 研究员仇雯 广州报道凭借一纸证书,就能获批100万、500万、甚至千万元贷款……数据要素链接金融市场开辟的新财路,正吸引着越来越多的入局者。南方财经全媒 3月21日,记者从陆军军医大学新桥医院获悉,该院普通外科开通甲乳结节AI早筛门诊,利用AI(人工智能)辅助诊断技术,成功为一名甲状腺乳头状癌患者成功实施手术提供了精准决策辅助。该院为重庆首家开通 3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光储高压先进技术发布会现场。阳光电源股份有 3月22日消息,根据huawei旗舰机型迭代策略,今年上半年将发布影像旗舰huaweiP70系列。然而,这两天一张流出的图片声称huaweiP70将于3月23日开始预售,并附有各个版本的具体售价。但据媒体报道,huawei相关 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 3月24日,据央视财经消息,在今天开幕的中国发展高层论坛2024年年会现场,苹果公司首席执行官蒂姆·库克回应记者提问表示,苹果公司的Apple Vision Pro头显产品将在今年年内于中国市场上市, 。

本文链接:OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用http://www.sushuapos.com/show-2-4435-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

下一篇: 我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员

热门资讯

  • 全国首个模拟验证机场开工

    记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。

  • 海龟深潜时一分钟心跳只有两次

    据《日本经济新闻》3月19日报道,东京大学副教授坂本健太郎等人研究发现,海龟下潜时心率将急剧下降。海龟与鲸等哺乳类动物同样,心率随下潜深度加深而

  • 人工智能医疗或将破解人体秘密

    美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同

  • 最小资源消耗的量子态分辨实现

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优

  • 多模态医疗大模型CARES Copilot 1.0发布 已面向香港神经外科医生开放使用

    记者3月21日获悉,由中国科学院自动化研究所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型——CARES Copilot 1.0日前在香

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • 全球首列氢能源市域列车完成满载运行试验

    3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/

  • “婴儿香”原来是真的香

    所谓香喷喷的婴儿,到底是源于人们的爱意,还是说确有其香?《通讯·化学》21日一项小型研究首次分析了婴儿和青少年体味化学组成的差异。研究显示

  • 饭后想吃零食或因神经元过度活跃

    那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠

  • Kimi累趴下了,券商仍看好

    21世纪经济报道记者雷晨 北京报道近日,国内AI领域的明星产品——Kimi智能助手,因流量激增遭遇了短暂的服务中断。月之暗面随后发布公告,对此

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

推荐资讯

  • 日榜
  • 周榜
  • 月榜