设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

问题越简单,人工智能越“糊涂”

发布时间: 来源: 中国科学报

 12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

9月25日,一项发表于《自然》的研究表明,当大型语言模型(LLM)变得更大并从人类反馈中学习时,它们在回答简单问题方面似乎变得不那么可靠。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大型语言模型能够回答各种各样的问题,但并不总是准确的。图片来源:Jamie Jin/Shutterstock12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ?12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人工智能开发人员试图通过两种主要方式提高LLM的能力,一是扩大规模,为其提供更多的训练数据和计算能力,二是根据人类反馈对其进行调整或微调。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

西班牙巴伦西亚理工大学的JoséHernández-Orallo和同事研究了LLM在规模扩大和调整过程中的表现。他们研究了OpenAI的GPT系列聊天机器人、Meta的LLaMA AI模型,以及一组名为BigScience的研究人员开发的BLOOM。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究人员通过设置5种类型的任务测试人工智能,即算术问题、解字谜、地理问题、科学挑战和从杂乱无章的列表中提取信息。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结果发现,扩大和调整可以使LLM更好地回答棘手的问题,比如将异序词“yoiirtsrphaepmdhray”重新排列为“甲状旁腺功能亢进症”。但两种方式与其在基本问题上的进步并不匹配,比如问及“当把24427和7120加在一起时,会得到什么”,LLM继续出错。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然在难题上的表现有所改善,但人工智能系统避免回答任何一个问题的可能性下降了——因为它不能。结果是,错误答案的可能性增加了。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Hernández-Orallo表示,研究结果突出了将人工智能描述为无所不知的危险,就像它们的创造者经常做的那样,而一些用户太容易相信了。“我们过度依赖和信任这些系统。”他说。12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是一个问题,因为人工智能模型对自己的知识范围并不诚实。英国牛津大学的Carissa Véliz说:“人类之所以超级聪明,部分原因在于有时我们没有意识到‘知之为知之,不知为不知’,但与大型语言模型相比,我们非常善于意识到这一点。大型语言模型不知道所拥有知识的极限。”12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相关论文信息:https://doi.org/10.1038/s41586-024-07930-y12p速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

? 2023年12月14日,自然科学基金委化学科学部在北京召开会议,对2017年度资助的国家自然科学基金创新研究群体项目进 12月17日,上海交通大学中银科技金融学院第一届科技成果转化大赛进行决赛。 中国银行上海市分行行长、党委书记张守川,上海 近日,由南京应用数学中心林文伟教授和东南大学李铁香教授团队设计研发、基于GPU计算平台的FAME软件包以仿真插件的形 ? 肖连团 ? 番兴明 ? 陈 勇 ? 马 洁(以上照片均为受访者提供) ? 数据来源:科技部、国 “科学探索奖”5周年之后再出发。作为目前国内金额最高的青年科技人才资助计划之一,第六届“科学探索 四川省科学技术厅关于组织申报2024年第二批中央在川高校院所“聚源兴川”项目的通知 各中央在川高校院所、市(州)科 。

本文链接:问题越简单,人工智能越“糊涂”http://www.sushuapos.com/show-11-11909-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 百年理论获证实:碳基化合物中发现单电子共价键

下一篇: 38个项目获2024年度“CCF科技成果奖”

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜