助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿
中新网北京2月5日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇计算机科学论文称,研究人员开发出一个开源语言模型OpenScholar,其在进行准确文献综述方面可超越商用大语言模型(LLM)。在本项研究开展的实验中,GPT4o会在78%-90%的情况下出现引文幻觉,而OpenScholar的引文准确率却与人类专家相仿。
论文作者指出,虽然OpenScholar后续仍需进一步优化,但该AI工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。
本项研究相关示意图(图片来自论文)。施普林格・自然 供图据介绍,科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。大语言模型可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。
为了生成准确、全面、透明的科学文献综述,美国华盛顿大学Akari Asai、Hannaneh Hajishirzi和同事及合作者一起,研发推出了开源语言模型OpenScholar。该模型是专为科研任务设计的检索增强语言模型,其他系统也用过这个框架,但论文作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合,从而优化其输出。
论文作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外,OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。
这些研究结果和引文幻觉大幅下降,证明了OpenScholar有望支持和推动进一步研究工作。论文作者也提醒说,该AI系统仍有局限性,同时,基于语言模型的系统无法使科学文献综述完全自动化。因此,他们向学界同时开放ScholarQABench和OpenScholar,以鼓励进一步研究和优化。(完)
中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合适的运动模式,实现靶向送药的同时还可以控制 监管AI,欧盟出手,美国掉队? 上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。 如今,伴随着ChatGPT、Sora的爆火,人工智能(AI)领域的激烈竞争,对该领域的监管 今年1月,英国分子生物学家肖尔托·戴维发表文章,指控美国哈佛大学医学院附属丹娜-法伯癌症研究所科学家通过修改图片伪造数据。随后该研究所正式宣布撤回6篇论文,并纠正了另外31篇论文的 人类的语言自产生以来,就不断演化发展。发音、词汇、语法的演变过程,是语言学家较为关注的领域。语言演化的根本动力是什么,演化又呈现出怎样的规律?我国科学家主导的一项心理学研究显示,人类的某 3月23日消息,据媒体报道,iPhone与百度公司已达成合作协议,百度将为苹果内置的生成式人工智能大模型提供技术支持。报道指出,iPhone生成式人工智能大模型的合作伙伴包含谷歌、百度、OpenAI等公司。国 中新经纬3月22日电 据《日本经济新闻》22日报道,夏普正在讨论缩小液晶显示器业务,夏普已将子公司显示器(SDP、位于市)停产纳入视野。显示器业务持续陷入苦战,成为夏普在2022财年(截至2023年3月)时隔5年陷入最终亏损 。本文链接:助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿http://www.sushuapos.com/show-2-15235-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。