春节前夕,一项基于人工智能技术的公益活动在广州市天河消防驻地开展。通过这项活动,消防员们只需用日常的语气录制十几句话,就能够获得一份自己语音制作出的有声故事集。
“对于我们来说,大年夜值守保安全是我们的职责。”广州市天河区消防救援大队代理指挥员老裴表示,由于春节期间不能回家,很希望能用其他方法陪伴孩子和家人。录制音频后,自己的声音能在自己值守时陪伴孩子鼓励孩子,在孩子背古诗、读历史、学英语的时候能感受到家长的期待和关爱。老裴录制音频后,由京东云言犀语音合成生成的英文故事就能以老裴的声音播放,即便过年不回家,老裴也能成为孩子的英语启蒙老师。
京东云言犀团队研发人员介绍,目前依托言犀大模型,参与者只需录制10句话样本,即可在30分钟内完成模型自动化训练与部署,还原真人音色、音调、语气。为了更逼真地模仿参与者,AI定制语音还支持广东话、成都话等多种方言以及多种外语。
据介绍,大模型让人工智能的训练时间更短,模仿更真实。在训练阶段,机器通过学习捕捉每个人说话的特色,将真人采集的2—3分钟语音,自动切分为10秒内短句,通过语音识别技术将语音转化为对应文本,同时提取音频的声学特征频谱,以此为目标值对基础模型进行微调。在合成阶段,输入的故事文本被分段、切句,并被传入训练好的语音模型,通过语音合成技术,模型会依次反馈和播放语音,同时后端持续合成。
大模型不仅惟妙惟肖还原音色,还将丰富的情感注入到声音中。相关技术人员介绍,通过风格迁移技术,京东云言犀支持文本重读、语调修饰,还可调整合成音色的风格韵律,实现睡前故事的娓娓道来、带货主播的慷慨激昂、文学朗读者的抑扬顿挫等不同场景的语气语调,通过情感判断模型以及知识库语义挖掘,大模型还可在多轮交互的客服场景中精准识别用户喜怒哀乐,给出匹配相应情绪的回答。
据了解,京东云言犀语音模型,训练时融合近6亿用户每日超1000万次的智能服务交互,每月累积超200万小时通话语音,积累了3000万个高质量问答知识点,覆盖广泛的知识图谱。
京东云相关负责人介绍,几年前,新闻主播、演员等群体能够获得自己的人工智能合成声音,随着技术的发展,普通公众也可以拥有自己的合成声音。目前,京东云言犀全自研的语音语义技术广泛应用于零售智能外呼、多模态数字人、政务热线等多个场景,例如支持全国首个12355青少年综合服务智能平台、不间断服务芜湖12345热线,并助力搭建智慧养老平台,为天津市河西区5000多位独居老人每天呼出关怀电话。
除了消防员群体,这次活动还为极地科考者、电商客服等春节必须值守工作岗位的群体克隆音色并生成陪伴故事,让他们的声音“回家”过春节。
(图片由活动主办方提供)
春节前夕,一项基于人工智能技术的公益活动在广州市天河消防驻地开展。通过这项活动,消防员们只需用日常的语气录制十几句话,就能够获得一份自己语音制作出的有声故事集。
“对于我们来说,大年夜值守保安全是我们的职责。”广州市天河区消防救援大队代理指挥员老裴表示,由于春节期间不能回家,很希望能用其他方法陪伴孩子和家人。录制音频后,自己的声音能在自己值守时陪伴孩子鼓励孩子,在孩子背古诗、读历史、学英语的时候能感受到家长的期待和关爱。老裴录制音频后,由京东云言犀语音合成生成的英文故事就能以老裴的声音播放,即便过年不回家,老裴也能成为孩子的英语启蒙老师。
京东云言犀团队研发人员介绍,目前依托言犀大模型,参与者只需录制10句话样本,即可在30分钟内完成模型自动化训练与部署,还原真人音色、音调、语气。为了更逼真地模仿参与者,AI定制语音还支持广东话、成都话等多种方言以及多种外语。
据介绍,大模型让人工智能的训练时间更短,模仿更真实。在训练阶段,机器通过学习捕捉每个人说话的特色,将真人采集的2—3分钟语音,自动切分为10秒内短句,通过语音识别技术将语音转化为对应文本,同时提取音频的声学特征频谱,以此为目标值对基础模型进行微调。在合成阶段,输入的故事文本被分段、切句,并被传入训练好的语音模型,通过语音合成技术,模型会依次反馈和播放语音,同时后端持续合成。
大模型不仅惟妙惟肖还原音色,还将丰富的情感注入到声音中。相关技术人员介绍,通过风格迁移技术,京东云言犀支持文本重读、语调修饰,还可调整合成音色的风格韵律,实现睡前故事的娓娓道来、带货主播的慷慨激昂、文学朗读者的抑扬顿挫等不同场景的语气语调,通过情感判断模型以及知识库语义挖掘,大模型还可在多轮交互的客服场景中精准识别用户喜怒哀乐,给出匹配相应情绪的回答。
据了解,京东云言犀语音模型,训练时融合近6亿用户每日超1000万次的智能服务交互,每月累积超200万小时通话语音,积累了3000万个高质量问答知识点,覆盖广泛的知识图谱。
京东云相关负责人介绍,几年前,新闻主播、演员等群体能够获得自己的人工智能合成声音,随着技术的发展,普通公众也可以拥有自己的合成声音。目前,京东云言犀全自研的语音语义技术广泛应用于零售智能外呼、多模态数字人、政务热线等多个场景,例如支持全国首个12355青少年综合服务智能平台、不间断服务芜湖12345热线,并助力搭建智慧养老平台,为天津市河西区5000多位独居老人每天呼出关怀电话。
除了消防员群体,这次活动还为极地科考者、电商客服等春节必须值守工作岗位的群体克隆音色并生成陪伴故事,让他们的声音“回家”过春节。
(图片由活动主办方提供)
记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为“大规模氢电一体化站关键技术、核心装备及 竹类植物是竹亚科植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功能研究,有效整理归纳盘活海量的竹类组学和分 在今天的故宫,工作人员使用的数字化办公平台名叫“内务辅”,这款应用的开发者,是与故宫博物院合作的钉钉(中国)信息技术有限公司(以下简称“钉钉”)。3月18日,故宫博物院与钉钉战略合作签约仪式在故 因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关页面和功能已经恢复正常。Kimi突然爆火,在A 盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明 澎湃新闻记者 吴遇利 Neuralink新技术或将造福数千万名失明人士。 当地时间3月21日,特斯拉CEO埃隆・马斯克在社交平台X(原推特)发文称, 作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得拥挤,24小时内,阿里、360、百度紧急“出手”,纷 。本文链接:人工智能定制语音助力值守者“回家”过春节http://www.sushuapos.com/show-2-2607-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 全国产算力平台“飞星一号”首个成果发布
下一篇: 体长超14米 我国发现命名恐龙新属种