8月30日,科大讯飞星火极速超拟人交互技术正式上线讯飞星火APP,率先面向全社会开放体验。根据官方介绍,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现重大突破,让整体交互体验更自然、更具情感。
《中国科学报》记者第一时间在讯飞星火APP上体验了该功能。可以看到,星火极速超拟人交互响应速度很快,支持随时打断;可以识别不同的情绪并呈现有代入符合情境的对话和回复,能觉察到其在有意减少“机械感”。
科大讯飞研究院常务副院长高建清介绍说,极速响应是确保一切体验的基础,也是区别于其它语音产品的关键能力。他解释说,“端到端”技术框架是实现极速响应的重点,该技术通过将此前级联方案升级为统一神经网络,直接实现语音到语音的“端到端”建模,从而大幅缩短响应时间,做到了真正的极速。
至于快速打断功能,高建清说,遇到错答、啰嗦回复等情况,立即打断是人的生理本能。但快速打断及响应其实是个极其复杂的工程问题,需要去判定何时打断、何时不应打断。“我们通过技术创新与强化底座认知能力,解决了打断和响应时间平衡的问题。”
星火极速超拟人语音交互技术路线图。科大讯飞 供图
人类语言具有独特的情绪感染力,能够传达复杂的情感和思想。但长久以来,智能语音与自然语言处理技术偏重于针对“内容”模块下功夫,比如能“听懂”更多的语种,“解答”更多的问题,缺少拟人化的对话方案。
高建清表示,想要获得拟人化的对话体验,需要“内容”与“情绪”等模块协同作用。而大模型时代的到来,恰好能让不同的模块化功能进行“大统一”。他对记者解释道:“以往语音交互系统都是不同的模块,比如语音识别、语音合成和大语言模型。而科大讯飞星火极速超拟人交互技术基于端到端大模型框架,结合讯飞多维度语音属性解耦表征训练模块,从而可实现情感、方言、韵律、音色等的可控,最终实现了对语音交互的拟人化升级。”
“我们将一万多条带明确情绪色彩的语音测试语音大模型,结果有8500多条回复能匹配相应的情绪。”高建清告诉《中国科学报》,讯飞星火语音大模型的超拟人功能,对多种情绪的可感知度达到85%以上,可使对话声音真实度、拟人度更强。
他认为,共情力对于大模型是一项重要的基础能力,或许在未来的人形机器人身上,我们将看到更具共情力的具象表达。他进一步提出,目前系统暂时不能使用表情,但未来如果将表情、声音内容与声音情绪三者结合在一起,将会是一条可行的新路径。
近日,网红考研名师张雪峰在直播中称“所有文科都叫服务业”,总结起来就是“舔”,引发坊间热议;之后,他在致歉回应中称“ 广西科学技术奖励委员会办公室关于2023年度通过广西科学技术奖行业评审进入综合评审成果的公示 根据《广西科学技术奖励 ? 2023年12月14日,自然科学基金委化学科学部在北京召开会议,对2017年度资助的国家自然科学基金创新研究群体项目进 距离地球“只有”大约2200万光年的超新星SN 2023ixf发生了爆炸,也许它不是浩渺宇宙中最独特的星体,但其爆炸却对地球上的 郭永怀、李佩、王承书、王希季、邓稼先、王淦昌、钱骥……一串令人肃然起敬的名字,在中国科学院大学(以下简称国科大)师生 中新网1月1日电 据国家地震台网官方微博消息,中国地震台网自动测定:1月1日15时10分在日本本州西岸近海附近(北纬37.98度,东 。本文链接:对情绪可感知度达85%,讯飞推“超拟人交互”http://www.sushuapos.com/show-11-10853-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
下一篇: 科技助力赤峰向“新”而行