设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

优化引文幻觉的AI来了

发布时间: 来源: 中国科学报

 kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一个新推出的开源语言模型OpenScholar,在进行准确文献综述方面可超越商用大语言模型(LLM)。比如,实验中,GPT4o会在78%-90%的情况下出现引文幻觉,而新的人工智能(AI)工具的引文准确率却与人类专家相仿。虽然仍需进一步优化,但该工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。相关研究成果2月5日发表于《自然》。
kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。LLM可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了生成准确、全面、透明的科学文献综述,美国西雅图华盛顿大学的Akari Asai、Hannaneh Hajishirzi和同事推出了OpenScholar。该模型是专为科研任务设计的检索增强语言模型。其他系统也用过这个框架,但作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合,从而优化其输出。作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外,OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。作者总结道,以上结果和引文幻觉大幅下降证明了OpenScholar有望支持和推动科学家的研究工作。kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但作者指出该系统仍有局限性,并强调基于语言模型的系统无法使科学文献综述完全自动化。他们向学界同时开放了ScholarQABench和OpenScholar,以鼓励进一步研究和优化。kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相关论文信息:https://doi.org/10.1038/s41586-025-10072-4kX6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

岁月不居,时节如流。转眼间,2023年已步入尾声。这一年给我们留下了太多值得铭记的精彩时刻:我国科学家成功制备并验证5 12月18日23时59分,甘肃省临夏回族自治州积石山保安族东乡族撒拉族自治县发生6.2级地震,震源深度10公里。截至19日16时50分 过去的数个月,对我国道路交通智能检测领域知名专家赵祥模教授来讲,一如既往地保持着忙碌而有序的“快节奏”,他从容地在多 12月16日,在2023开放原子开发者大会上,腾讯云宣布将企业级分布式数据库TDSQL的社区发行版OpenTenBase 捐赠给开放原子 法国政府近日推出“2030国家生物多样性战略”,包括40项措施和200项行动,旨在保护和恢复生态系统、减少对生物多样性的 ·GLP-1类药物正在以令人兴奋和不安的方式重塑医学、流行文化,甚至全球股市。制药公司掀起一场“肥胖革命”,但 。

本文链接:优化引文幻觉的AI来了http://www.sushuapos.com/show-11-31523-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 科学家揭示维系宇宙运行的隐秘结构

下一篇: 晚睡会增加患心脏病的风险

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜