设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI语音模型“炸场” 15秒样本即可复刻人声

2024-04-08 08:55:04 来源:

  OpenAI语音模型“炸场” 15秒样本即可复刻人声ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  21世纪经济报道记者孔海丽 实习生牛淑锐 北京报道ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型―Voice Engine公之于众。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  利用文本输入和单个15秒音频样本,Voice Engine就能生成与原说话者非常相似且情感丰富的自然语音。不过,和文本生成视频模型Sora一样,目前OpenAI只针对少部分内测用户开放Voice Engine。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI在其官网披露,2022年底,Voice Engine就被首次开发,并已经用它来支持文本转语音API以及ChatGPT语音和朗读中可用的预设语音。但考虑到合成语音被滥用的潜在风险,OpenAI选择了谨慎有序地推进和发布Voice Engine。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  近两年,全球生成式AI应用规模呈现爆发式增长。据IDC预测,全球AI软件市场规模有望从2022年的640亿美元增长至2027年的2790亿美元,复合增长率为31.4%。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  华泰证券分析师认为,随着基础模型能力优化,多模态应用有望在内容创作、AI教育、虚拟陪伴等场景加速落地。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Voice Engine的问世,解锁了语音模型的更多可能性,例如辅助阅读、视频转译等,也将在发音障碍人群的语言表达上提供有效帮助。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  当AI瞄准声音克隆技术ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  去年,霉霉说地道中文的视频火上微博热搜,而这背后的AI工具来自Voice Engine的采用者之一―AIGC初创公司HeyGen,此话题的阅读量超600万。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  通过Voice Engine进行实时转换翻译,说话者将保留原始口音,原语言不仅能转换成中文、英文、日文等各类语言,也能让面部嘴型完美匹配。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  除此之外,特朗普随口飙一段中文、郭德纲用英语说相声、蔡明阿姨讲段子的视频也在各大社交平台上广为流传。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Voice Engine的官宣也有迹可循。2024年3月19日,OpenAI已经为“Voice Engine”申请了商标,商标的覆盖范围主要是围绕语音识别、语音合成和语音生成等方面。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  谷歌前员工Jonathan Chavez也曾在前段时间透露,OpenAI将在今年推出一款全球最好的个人助理产品,就像钢铁侠中的Jarvis。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  果不其然,Voice Engine如期而至,团队还公示了多场景下的内测结果与相关音频。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  根据OpenAI的介绍,Voice Engine能够通过自然、富有感情的声音为非读者和儿童提供阅读帮助;可以翻译视频和播客等内容,以便创作者和企业可以用自己的声音流利地接触世界各地的更多人;支持非语言人群和帮助患有突发性或退化性言语病症的患者恢复声音。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI语音引擎产品团队成员杰夫・哈里斯 (Jeff Harris)表示,该模型是根据“许可数据和公开数据的组合”进行训练的。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于Voice Engine的进展,网友直呼:“人工智能的发展速度令人兴奋,势不可挡。”ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从业人士认为,Voice Engine将对播客、配音艺术家、口语表演者、有声书和广告解说员、游戏玩家、流媒体主播、客户服务代理、销售人员等众多职业带来现实影响,这其中也包括就业压力。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  大众也期待,当OpenAI的Sora与Voice Engine这两项前沿科技相碰撞,又会擦出什么样的火花,真正意义上的有声AI视频乃至电影短片,是不是也就不远了。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  勒紧“深度伪造”的缰绳ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于Voice Engine技术的使用,除了惊喜与赞叹声,也有人提出了质疑,如果这样的技术用于电信诈骗,后果会很可怕。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有在校大学生告诉21世纪经济报道记者,家长曾接到AI伪造学生声音的诈骗电话。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  其实,OpenAI去年所发布“可以说话”的ChatGPT版本,长期以来一直为各种企业提供根据配音演员的录音所创建的声音,并没有发布从短视频中复制声音的技术。 OpenAI产品经理杰夫・哈里斯(Jeff Harris)表示,以这种方式复制任何声音的能力是有风险的。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2024年2月,美国曾发生利用AI生成语音影响选民投票事件。据报道,在大选之际,新罕布什尔州的部分选民接到一个神秘来电,电话中酷似美国总统拜登的声音号召他们不要在该州初选中投票。后经证实,该来电是机器人语音电话,并非拜登本人录制。此事件在当时引起了不小的轰动,加剧了人们对竞选“深度伪造”的担忧。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为加强语音引擎的安全构建,OpenAI在官方公告中称,公司正在与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴合作,以确保在建设过程中吸收他们的反馈。 不过,OpenAI与这些合作伙伴针对语音引擎的业务进展,需要原始发言者的明确和知情同意,合作伙伴还必须清楚地向观众强调,他们听到的声音是由AI生成的。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI将为AI生成的语音添加水印,以追踪并主动监控其使用方式,以确保其透明度和安全度。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI官方表示:“我们目前不会广泛发布这项技术,仅小部分开放内测,希望语音引擎的这次内测既能强调其潜力,又能增强潜在问题的抵御能力,以应对越来越逼真的生成模型带来的挑战。”ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,他们还将采取一系列安全措施,包括逐步淘汰基于语音的身份验证作为访问银行账户和其他敏感信息的安全措施;探索保护人工智能中个人声音使用的政策;教育公众了解人工智能技术的能力和局限性,包括欺骗性人工智能内容的可能性;加速开发和采用追踪视听内容来源的技术等。ibV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:OpenAI语音模型“炸场” 15秒样本即可复刻人声http://www.sushuapos.com/show-2-4631-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 抱抱脸Open了OpenAI的秘密武器,网易参与复现

下一篇: AI有了联想,世界将会怎样?

热门资讯

  • 全国首个煤炭行业能源智算中心在山西建成

    3月18日,记者从山西省人民政府获悉,“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公

  • 让肺部磁共振成像从“不可看”到“看得清”

    患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情

  • 人工智能医疗或将破解人体秘密

    美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • 国家工程师丨锻造能“听”清眼疾的高精设备

    眼眸深邃似海、璨如星河,中国医学科学院生物医学工程研究所眼科诊疗技术研发团队(以下简称“团队”)正是眼眸“侦探”。该团队不久前被授予“国家卓越

  • AI辅助诊断实现无创判定甲状腺结节良恶性

    3月21日,记者从陆军军医大学新桥医院获悉,该院普通外科开通甲乳结节AI早筛门诊,利用AI(人工智能)辅助诊断技术,成功为一名甲状腺乳头状癌患者成功实施手

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • 饭后想吃零食或因神经元过度活跃

    那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠

  • 曝huaweiMate60已停产!P70蓄势待发:下个月见

    近日有消息称,huaweiMate60已经停产。作为huawei于2023年8月末发布的最新旗舰机型,huaweiMate60的停产意味着huawei新款旗舰或即将上市,接替Mate60。2023

  • 南财观察丨操作系统与一座城:全球“鸿蒙之城”深圳造

    21世纪经济报道记者 石恩泽 深圳报道操作系统似乎对地理入迷。鸿蒙和深圳,就像Windows和西雅图,也似Linux和赫尔辛基。这是地理与技术的紧密

推荐资讯

  • 日榜
  • 周榜
  • 月榜