优化引文幻觉的AI来了

发布时间: 2026-02-06 09:02:38 来源：中国科学报

观看：51

一个新推出的开源语言模型OpenScholar，在进行准确文献综述方面可超越商用大语言模型（LLM）。比如，实验中，GPT4o会在78%-90%的情况下出现引文幻觉，而新的人工智能（AI）工具的引文准确率却与人类专家相仿。虽然仍需进一步优化，但该工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。相关研究成果2月5日发表于《自然》。

科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而，文献发表数量的增长使研究人员很难掌握全部资讯。LLM可以提供协助，但却很容易出错，如归因能力有限和引文幻觉。

为了生成准确、全面、透明的科学文献综述，美国西雅图华盛顿大学的Akari Asai、Hannaneh Hajishirzi和同事推出了OpenScholar。该模型是专为科研任务设计的检索增强语言模型。其他系统也用过这个框架，但作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合，从而优化其输出。作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示，OpenScholar的准确率比GPT4o和PaperQA2（一个文献综述工具）这类现有系统分别高出6.1%和5.5%。此外，OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。作者总结道，以上结果和引文幻觉大幅下降证明了OpenScholar有望支持和推动科学家的研究工作。

但作者指出该系统仍有局限性，并强调基于语言模型的系统无法使科学文献综述完全自动化。他们向学界同时开放了ScholarQABench和OpenScholar，以鼓励进一步研究和优化。

相关论文信息：https://doi.org/10.1038/s41586-025-10072-4

广东省科学院生态环境与土壤研究所研究员刘芳华团队在电能微生物和水铁矿促进产氢机制方面取得新进展。近日，相关成果先欧洲空间局公布了“欧几里德”空间望远镜拍摄的首批彩色图像，有助于揭示暗物质和暗能量等宇宙奥秘。图为马头星云的 ·“我相信，有一天我们将能够以像手术那样的精确度来改变致病基因。” ·“目前还没有在大脑中使用任 12月17日，记者从北京协和医院获悉，由该院儿科主编的《儿童风湿免疫病标准数据集》（以下简称数据集）正式发布。专家表示，作为中新网1月1日电据法新社最新消息，日本政府表示，强震发生后没有核电站出现异常的报告。日本石川县能登地区1日下午关于发布“2023年度华夏建设科学技术奖”授奖项目的公示华夏奖字〔2023〕第4号各有关单位： 2023年度华夏建设科学技术。

本文链接：优化引文幻觉的AI来了http://www.sushuapos.com/show-11-31523-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：科学家揭示维系宇宙运行的隐秘结构

下一篇：晚睡会增加患心脏病的风险

优化引文幻觉的AI来了

热门资讯

推荐资讯

科学最热文章