“语音引擎”可从15秒样本复制原声

发布时间: 2024-04-02 17:07:54 来源：科技日报

观看：322

据著名科技网站The Verge报道，OpenAI公司3月29日最新推出了一项名为“语音引擎”（Voice Engine）的人工智能工具，其仅凭一段15秒的声音样本，便能够精准模仿出该人的声音。

OpenAI称，该引擎自2022年底以来一直在开发中，实际已在ChatGPT应用程序的“大声朗读”功能中应用，该功能顾名思义会向用户朗读相关内容。

用户只需利用15秒的样本来训练声音，就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示，它可用于教育目的，将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻，尽管它们有轻微生硬的机器人痕迹。

“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音；将视频内容翻译成多种语言，以拓宽其全球受众范围。这项技术的一大特色是，在翻译过程中能够保留演讲者原有的口音特征，为翻译增添了更多真实感和个性化色彩。

“语音引擎”还可为语言障碍者提供支持，例如开发针对语言障碍者的治疗应用，为有特殊学习需求的人提供教育辅助，使用户能选择最能体现其个性的声音，并且对那些使用多种语言的用户，保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频，成功恢复了她因血管性脑瘤而失去的流畅语言能力。

OpenAI目前并未立即向市场全面推广，而是选择与少数早期测试者谨慎地合作，共同探索“语音引擎”的应用可能和潜在风险。

“语音引擎”目前仅处于有限测试阶段，主要原因是担心被滥用。OpenAI指出，“语音引擎”可能导致语音身份验证措施出现问题，以及让大众在误以为自己与熟人通话的情况下涉入骗局。

OpenAI表示希望进行更多研究，以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。

据著名科技网站The Verge报道，OpenAI公司3月29日最新推出了一项名为“语音引擎”（Voice Engine）的人工智能工具，其仅凭一段15秒的声音样本，便能够精准模仿出该人的声音。

OpenAI称，该引擎自2022年底以来一直在开发中，实际已在ChatGPT应用程序的“大声朗读”功能中应用，该功能顾名思义会向用户朗读相关内容。

用户只需利用15秒的样本来训练声音，就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示，它可用于教育目的，将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻，尽管它们有轻微生硬的机器人痕迹。

“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音；将视频内容翻译成多种语言，以拓宽其全球受众范围。这项技术的一大特色是，在翻译过程中能够保留演讲者原有的口音特征，为翻译增添了更多真实感和个性化色彩。

“语音引擎”还可为语言障碍者提供支持，例如开发针对语言障碍者的治疗应用，为有特殊学习需求的人提供教育辅助，使用户能选择最能体现其个性的声音，并且对那些使用多种语言的用户，保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频，成功恢复了她因血管性脑瘤而失去的流畅语言能力。

OpenAI目前并未立即向市场全面推广，而是选择与少数早期测试者谨慎地合作，共同探索“语音引擎”的应用可能和潜在风险。

“语音引擎”目前仅处于有限测试阶段，主要原因是担心被滥用。OpenAI指出，“语音引擎”可能导致语音身份验证措施出现问题，以及让大众在误以为自己与熟人通话的情况下涉入骗局。

OpenAI表示希望进行更多研究，以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。

今年全国两会期间，人工智能成为热点话题，“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局，一头连着行业变革与创新，“人工智能+”既是新质生产力发展的“新引擎”，也是产业和消费 3月20日8时31分，探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后，星箭分离，将鹊桥二号中继星直接送入近地点高度200公里、远地点高度42 21世纪经济报道记者孔海丽、实习生邓熙涵北京报道“民以食为天，食与民同欢”，吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者已不止于填饱肚子，而是讲求“精耕细作”。消 3月22日消息，根据huawei旗舰机型迭代策略，今年上半年将发布影像旗舰huaweiP70系列。然而，这两天一张流出的图片声称huaweiP70将于3月23日开始预售，并附有各个版本的具体售价。但据媒体报道，huawei相关 3月22日消息，今天，数码博主“数码闲聊站”曝光了一部新款千元机的部分配置。该博主表示，欧加（OPPO/一加）有个5500mAh超大电池的千元曲屏机，正在测试IP68级防尘防水效果，主打就是防水抗摔耐用。该博主最为构建有效联动、密切配合的青少年科学教育协同机制，提升科学教育实施效能，3月23日，北京市关心下一代工作委员会（以下简称“北京市关工委”）、北京市科学技术协会（以下简称“北京市科协”）在北京科。

本文链接：“语音引擎”可从15秒样本复制原声http://www.sushuapos.com/show-2-4523-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：最广泛灵长类动物大脑研究结果发布

下一篇：新技术提升嘉定白蒜品质产量

“语音引擎”可从15秒样本复制原声

热门资讯

推荐资讯

科技最热文章