问题越简单，人工智能越“糊涂”

发布时间: 2024-09-30 10:49:31 来源：中国科学报

观看：177

9月25日，一项发表于《自然》的研究表明，当大型语言模型（LLM）变得更大并从人类反馈中学习时，它们在回答简单问题方面似乎变得不那么可靠。

大型语言模型能够回答各种各样的问题，但并不总是准确的。图片来源：Jamie Jin/Shutterstock

?

人工智能开发人员试图通过两种主要方式提高LLM的能力，一是扩大规模，为其提供更多的训练数据和计算能力，二是根据人类反馈对其进行调整或微调。

西班牙巴伦西亚理工大学的JoséHernández-Orallo和同事研究了LLM在规模扩大和调整过程中的表现。他们研究了OpenAI的GPT系列聊天机器人、Meta的LLaMA AI模型，以及一组名为BigScience的研究人员开发的BLOOM。

研究人员通过设置5种类型的任务测试人工智能，即算术问题、解字谜、地理问题、科学挑战和从杂乱无章的列表中提取信息。

结果发现，扩大和调整可以使LLM更好地回答棘手的问题，比如将异序词“yoiirtsrphaepmdhray”重新排列为“甲状旁腺功能亢进症”。但两种方式与其在基本问题上的进步并不匹配，比如问及“当把24427和7120加在一起时，会得到什么”，LLM继续出错。

虽然在难题上的表现有所改善，但人工智能系统避免回答任何一个问题的可能性下降了——因为它不能。结果是，错误答案的可能性增加了。

Hernández-Orallo表示，研究结果突出了将人工智能描述为无所不知的危险，就像它们的创造者经常做的那样，而一些用户太容易相信了。“我们过度依赖和信任这些系统。”他说。

这是一个问题，因为人工智能模型对自己的知识范围并不诚实。英国牛津大学的Carissa Véliz说：“人类之所以超级聪明，部分原因在于有时我们没有意识到‘知之为知之，不知为不知’，但与大型语言模型相比，我们非常善于意识到这一点。大型语言模型不知道所拥有知识的极限。”

相关论文信息：https://doi.org/10.1038/s41586-024-07930-y

2024年度中日韩前瞻计划项目指南 “中日韩前瞻计划”（A3 Foresight Program）是国家自然科学基金委员会（NSFC）与日本学如果有一只眼睛，能帮我们一直看到中国南海海底深处，会看到什么？除了深邃黑暗的海洋，慢慢爬动的潜铠虾和海底岩石等，好像还有近日，北京市政府办公厅发布了《北京市关于推动科技企业孵化器创新发展的指导意见》（以下简称《指导意见》）。12月19日， 12月17日，上海交通大学中银科技金融学院第一届科技成果转化大赛进行决赛。中国银行上海市分行行长、党委书记张守川，上海教育、科技、人才三者相互促进、相辅相成。如何构建符合人才成长规律的教育评价机制，让更多优秀的科技人才脱颖而出？如何中新社北京1月1日电 (记者阮煜琳)中国自然资源部海啸预警中心消息，日本本州西岸近海海域1月1日发生7.4级地震已引发。

本文链接：问题越简单，人工智能越“糊涂”http://www.sushuapos.com/show-11-11909-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：百年理论获证实：碳基化合物中发现单电子共价键

下一篇： 38个项目获2024年度“CCF科技成果奖”

问题越简单，人工智能越“糊涂”

热门资讯

推荐资讯

科学最热文章