瞄准幻觉治理，讯飞星火X1再升级

发布时间: 2025-07-27 08:23:32 来源：中国科学报

观看：87

“一本正经地胡说八道”，是许多人对当前开放式内容生成功能不满的方面。7月25日，科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级，此次升级的重点就瞄准幻觉治理。

据科大讯飞研究院院长刘聪介绍，星火X1此次升级取得的最大突破，就是无论是对自身生成内容真实性的把控（事实性幻觉治理），还是在参考外部资料时对原文的忠实程度（忠实性幻觉治理），都有显著改善，大大提升了大模型在行业应用中的可靠性。

“整体来看，新版本星火X1的综合能力大幅提升，在翻译、推理、文本生成、数学等核心能力上已能对标OpenAI o3等国际一流大模型最新版本效果，多语言能力更是扩展至130余种。”刘聪表示，与此同时，基于星火X1的语音同传大模型也迎来全面升级，教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破，在复杂行业场景任务上进一步满足用户核心需求。

面对大模型容易“胡说八道”的通病，科大讯飞大模型技术团队提出了基于多路径采样验证及事实性约束强化学习的“幻觉治理技术”。在该技术加持下，大模型在思考过程及回复生成阶段，能实现客观问题与标准答案的深度强对齐，大幅减少了在慢思考下的幻觉率，让大模型回复通用常识及专业知识问题时更加可靠。

此外，在数据层面，科大讯飞还开创性地提出了基于人类专家数据的通用认知任务数据反写技术，有效地解决了有监督微调下高质量数据获取困难、人工标注费时费力等现实挑战，实现了主观语言类任务文笔和风格化的显著提升。

星火X1的升级并非只停留在技术层面，其核心价值在于深入解决各行业的复杂场景需求，推动AI真正融入生产生活。得益于星火X1的升级，其在教育、医疗、企业应用、代码、科研等多个行业场景的能力也“水涨船高”，应用更深入。

例如，借助星火X1的升级赋能，星火医疗大模型在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上也实现了能力的跃升。其中，在医生辅助诊疗方面，星火应用范围不断扩大，已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点，效果表现持续亮眼。

此外，升级后的语音同传技术已全面应用于讯飞双屏翻译机、讯飞AI录音笔及同传服务，并作为2025世界人工智能大会（WAIC）唯一翻译合作伙伴，为大会提供无障碍沟通支持。

12月11~15日，第32届Texas相对论天体物理学研讨会（Texas Symposium on Relativistic Astrophysics）在上海交通大学李政 “老年人肺部感染是推倒老年人体重要机能的第一张‘多米诺骨牌’。预防老年人的呼吸道感染，最重要的一是做好免疫接中新网北京12月19日电 (记者孙自法)施普林格·自然旗下专业学术期刊《自然-医学》最新发表一篇论文称，研究人 ·“由于猫只在很短的时间内排出生物体，因此人类通过与它们一起生活的猫接触而感染弓形虫的机会相对较小。也就是研究生教育是高等教育的最高层次，是衡量一个国家高等教育竞争力的关键标志，是拔尖创新人才自主培养的主渠道。在研究近期，多所高校组织了钓鱼邮件网络安全演练，结果显示部分高校有相当比例的师生“中招”。例如，太原工业学院微信公众。

本文链接：瞄准幻觉治理，讯飞星火X1再升级http://www.sushuapos.com/show-11-23856-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：城市多灾种早期预警智能体开启跨国气象防灾减灾使命

下一篇：第二届全国交通智能建造学术会议在武汉召开

瞄准幻觉治理，讯飞星火X1再升级

热门资讯

推荐资讯

科学最热文章