“一本正经地胡说八道”,是许多人对当前开放式内容生成功能不满的方面。7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级,此次升级的重点就瞄准幻觉治理。
据科大讯飞研究院院长刘聪介绍,星火X1此次升级取得的最大突破,就是无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善,大大提升了大模型在行业应用中的可靠性。
“整体来看,新版本星火X1的综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上已能对标OpenAI o3等国际一流大模型最新版本效果,多语言能力更是扩展至130余种。”刘聪表示,与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。
面对大模型容易“胡说八道”的通病,科大讯飞大模型技术团队提出了基于多路径采样验证及事实性约束强化学习的“幻觉治理技术”。在该技术加持下,大模型在思考过程及回复生成阶段,能实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题时更加可靠。
此外,在数据层面,科大讯飞还开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了有监督微调下高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。
星火X1的升级并非只停留在技术层面,其核心价值在于深入解决各行业的复杂场景需求,推动AI真正融入生产生活。得益于星火X1的升级,其在教育、医疗、企业应用、代码、科研等多个行业场景的能力也“水涨船高”,应用更深入。
例如,借助星火X1的升级赋能,星火医疗大模型在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上也实现了能力的跃升。其中,在医生辅助诊疗方面,星火应用范围不断扩大,已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点,效果表现持续亮眼。
此外,升级后的语音同传技术已全面应用于讯飞双屏翻译机、讯飞AI录音笔及同传服务,并作为2025世界人工智能大会(WAIC)唯一翻译合作伙伴,为大会提供无障碍沟通支持。
12月16-17日,北京大学经济学院举办第六届“中国百所大学经济学院院长论坛”暨“首届孙尚清发展知识研究与交流奖颁奖典礼 近日,全国教育信创与密码行业产教融合共同体成立大会及新疆职业院校产教融合人才培养论坛于在乌鲁木齐举办。 航天 上海生物医药产业怎么做到产学研合力?12月14日,澎湃新闻记者从上海张江一场共话人才未来产学研合作的闭门会议获悉,前 科技日报北京12月19日电 (记者马爱平)19日,记者从中国农业科学院茶叶研究所获悉,该所茶叶质量与风险评估创新团队首创了 12月18日23时59分,甘肃省临夏回族自治州积石山保安族东乡族撒拉族自治县发生6.2级地震,震源深度10公里。截至19日16时50分 12月17日,上海交通大学中银科技金融学院第一届科技成果转化大赛进行决赛。 中国银行上海市分行行长、党委书记张守川,上海 。本文链接:瞄准幻觉治理,讯飞星火X1再升级http://www.sushuapos.com/show-11-23856-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
下一篇: 第二届全国交通智能建造学术会议在武汉召开