AI心理推断能力或与人类相当，但不意味着它们有像人那样的情商

发布时间: 2024-05-23 17:32:07 来源：中国科技网

观看：225

新一期《自然·人类行为》发表论文显示，在测试追踪他人心理状态能力——也称心智理论（Theory of Mind）的任务中，两类大语言模型（LLM）在特定情况下的表现与人类相似，甚至更好。

心智理论对人类社交互动十分重要，是人类沟通交流和产生共鸣的关键。之前的研究表明，LLM这类人工智能（AI）可以解决复杂的认知任务，如多选决策。不过，人们一直不清楚LLM在心智理论任务（被认为是人类独有的能力）中的表现是否也能比肩人类。

此次，德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务，包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现，GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平，而LLaMA2的表现逊于人类水平；在识别失礼方面，LLaMA2强于人类但GPT表现不佳。研究人员指出，LLaMA2的成功是因为回答的偏见程度较低，而不是因为真的对失礼敏感；GPT看起来的失利，其实是因为对坚持结论的超保守态度，而不是因为推理错误。

研究团队认为，LLM在心智理论任务上的表现堪比人类，不等于它们具有人类般的“情商”，也不意味着它们能掌握心智理论。但他们也指出，这些结果是未来研究的重要基础，并建议进一步研究LLM在心理推断上的表现，以及这些表现会如何影响人类在人机交互中的认知。

总编辑圈点：

情商，就是情绪智力，主要是指人在情绪、情感、意志、耐受挫折等方面的品质。有时候，我们不知道如何回复上司的一句“辛苦了”，亲戚的一句“你这工作能挣多少”，也会求助大模型，希望这凝聚了人类智慧的语言模型能给出一些缓解尴尬或令人愉悦的建议。但大模型有情商吗？大模型可以表现出有情商的样子，但它显然无法揣测人心的幽微之处，也无法体会出所谓话外有话，这些独属于人类社交互动的复杂之处，大模型还需要进一步学习。

新一期《自然·人类行为》发表论文显示，在测试追踪他人心理状态能力——也称心智理论（Theory of Mind）的任务中，两类大语言模型（LLM）在特定情况下的表现与人类相似，甚至更好。

心智理论对人类社交互动十分重要，是人类沟通交流和产生共鸣的关键。之前的研究表明，LLM这类人工智能（AI）可以解决复杂的认知任务，如多选决策。不过，人们一直不清楚LLM在心智理论任务（被认为是人类独有的能力）中的表现是否也能比肩人类。

此次，德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务，包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现，GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平，而LLaMA2的表现逊于人类水平；在识别失礼方面，LLaMA2强于人类但GPT表现不佳。研究人员指出，LLaMA2的成功是因为回答的偏见程度较低，而不是因为真的对失礼敏感；GPT看起来的失利，其实是因为对坚持结论的超保守态度，而不是因为推理错误。

研究团队认为，LLM在心智理论任务上的表现堪比人类，不等于它们具有人类般的“情商”，也不意味着它们能掌握心智理论。但他们也指出，这些结果是未来研究的重要基础，并建议进一步研究LLM在心理推断上的表现，以及这些表现会如何影响人类在人机交互中的认知。

总编辑圈点：

情商，就是情绪智力，主要是指人在情绪、情感、意志、耐受挫折等方面的品质。有时候，我们不知道如何回复上司的一句“辛苦了”，亲戚的一句“你这工作能挣多少”，也会求助大模型，希望这凝聚了人类智慧的语言模型能给出一些缓解尴尬或令人愉悦的建议。但大模型有情商吗？大模型可以表现出有情商的样子，但它显然无法揣测人心的幽微之处，也无法体会出所谓话外有话，这些独属于人类社交互动的复杂之处，大模型还需要进一步学习。

3月18日，记者从山西省人民政府获悉，“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公司共同打造，是山西省目前唯一的垂直行业类智据阿根廷布宜诺斯艾利斯经济新闻网报道，一项国际研究发现，阿尔茨海默病的早期症状可能表现在视力上。研究显示，即便眼科检查结果正常，但阅读、估计距离和触及物体的困难都是可能揭示阿尔茨海默病记者3月20日来到广东深汕西高速公路改扩建施工现场，看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日，由茅以升科技教育基金会和广东省交通集团联合主办的全国高速 3月22日消息，一加Ace 3V昨晚发布，起售价1999元，将于3月25日正式发售。现在这款新机已经来到我们评测室，下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙7+移动平台，采用骁龙8 Gen3相同的4nm制程工 3月25日消息，去年huawei在Mate 60系列上首发了玄武机身架构，采用一体化金属机身，搭配上超耐用锦纤材质，使整机的抗挤压能力提高10倍，使用更放心。“玄武”是极其坚固的代表，huawei还在问界M9上采用了“ 随着无人驾驶技术的快速发展，无人车在城市配送、环卫清扫、安防巡逻等应用场景中已得到较好示范应用。3月22日，南京溧水经济开发区管委会与南京易咖智车科技有限公司联合举办“金陵智地易启未。

本文链接：AI心理推断能力或与人类相当，但不意味着它们有像人那样的情商http://www.sushuapos.com/show-2-6208-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：推动“昆蒙框架”落实，共筑生物多样性网络

下一篇：破解“富矿挖不出宝藏”难题——山东探索科技金融新模式

AI心理推断能力或与人类相当，但不意味着它们有像人那样的情商

热门资讯

推荐资讯

科技最热文章