设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

大语言模型仍无法可靠区分信念与事实

发布时间: 来源: 科技日报

 SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

科技日报北京11月6日电 (记者张梦然)在最新一期《自然·机器智能》发表的一篇论文中,美国斯坦福大学研究提醒:大语言模型(LLM)在识别用户错误信念方面存在明显局限性,仍无法可靠区分信念还是事实。研究表明,当用户的个人信念与客观事实发生冲突时,LLM往往难以可靠地作出准确判断。SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片由AI生成

SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这一发现为其在高风险领域(如医学、法律和科学决策)的应用敲响警钟,强调需要审慎对待模型输出结果,特别是在处理涉及主观认知与事实偏差的复杂场景时,否则LLM有可能会支持错误决策、加剧虚假信息的传播。SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队分析了24种LLM(包括DeepSeek和GPT-4o)在13000个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真或假时,较新的LLM平均准确率分别为91.1%或91.5%,较老的模型平均准确率分别为84.8%或71.5%。当要求模型回应第一人称信念(“我相信……”)时,团队观察到LLM相较于真实信念,更难识别虚假信念。具体而言,较新的模型(2024年5月GPT-4o发布及其后)平均识别第一人称虚假信念的概率比识别第一人称真实信念低34.3%。相较第一人称真实信念,较老的模型(GPT-4o发布前)识别第一人称虚假信念的概率平均低38.6%。SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队指出,LLM往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念(“Mary相信……”)时,较新的LLM准确性降低4.6%,而较老的模型降低15.5%。SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究总结说,LLM必须能成功区分事实与信念的细微差别及其真假,从而对用户查询作出有效回应并防止错误信息传播。SSx速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月13-14日,第15届中美绿色能源论坛在南京召开。论坛由中国电机工程学会、美中绿色能源促进会主办,以“碳中和实现路径与 日前,高等教育数字化与课程思政建设研讨会暨中国高校财经慕课联盟首届“同课异构”教学竞赛颁奖典礼在对外经济贸易大学 过去的数个月,对我国道路交通智能检测领域知名专家赵祥模教授来讲,一如既往地保持着忙碌而有序的“快节奏”,他从容地在多 “超高清双频IVUS系统于12月12日在西安交通大学第一附属医院由心血管病院院长袁祖贻团队成功完成首例冠脉介入手术(PCI)患 近日,日本新潟大学等机构参与的一个国际研究团队报告,他们利用载人潜水器调查了日本海沟,在海底发现了2011年日本“ 关于发布《中国博士后科学基金资助指南(2024年度)》的通知 中博基字〔2024〕2号 各省、自治区、直辖市及新疆生产 。

本文链接:大语言模型仍无法可靠区分信念与事实http://www.sushuapos.com/show-11-27765-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 别让拔罐养生变“伤身”

下一篇: 超导量子比特相干时间纪录刷新

热门资讯

推荐资讯

  • 脑智卓越中心揭示脚桥核谷氨酸环路调控多种运动功能

    脚桥核(PPN)被认为是运动调控的重要脑区,而脚桥核中谷氨酸能(vGluT2)神经元对运动控制的贡献在临床和基础研究中存在争议。临床上,脚桥核是帕金森病患者深部脑刺激(DBS)的潜在

  • 福建物构所锰基有机金属卤素杂化闪烁体研究取得进展

    X射线探测技术在疾病诊断、异物检测等领域具有重要作用。闪烁体作为X射线探测技术的核心器件,是一类可以将高能辐射如X/γ射线、α/β粒子、中子转化为可见光或近可见

  • 2024年世界职业技术教育发展大会将举办

      本报北京11月14日讯(记者 欧媚)记者从今天举行的教育部新闻发布会上获悉,2024年世界职业技术教育发展大会将于11月20日—22日在天津举办。这是全国教育大会后我国首场教育

  • 澎湃青春力量,在创新创造中汇聚

      “我们愿在中国式现代化的浪潮中为科技强国贡献一份青春力量!”  “参与大赛这些年,看着我们在课堂里的知识笔记一步步变成了田野里的实践论文,感慨万分。”  11月13日

  • 教育为残疾学生插上逆风飞翔的翅膀

      在“我来北京上大学”2024年残疾人大学生分享会上,来自清华大学、北京邮电大学、中国传媒大学、中央音乐学院等高校的6名残疾人大学生,分享了他

  • 江苏海安:萌娃学做饭

    11月14日,在江苏省海安市墩头镇吉庆幼儿园“户外小厨房”内,小朋友们在老师的指导下,学习洗菜、切菜、炒菜、生火做饭等劳动技能,让孩子们在有趣的劳动

  • 安徽芜湖:职教学子赛技能

    11月14日,第九届安徽省智慧家设计集成职业技能竞赛信息通信网络终端维修员赛项在芜湖市繁昌区芜湖机械工程学校开赛,来自安徽省各地近20名职教学生参

  • 浙江省海宁市黄湾镇中心幼儿园:“定向游戏”把课堂搬进大自然

    中国教育报-中国教育新闻网讯(通讯员 廖钗勤 记者 蒋亦丰)最近,浙江省海宁市黄湾镇中心幼儿园举办了一场趣味盎然的“重走长征路”活动。活动中,幼儿们

  • 推进学前教育依法治理

    近年来,学前教育得到快速发展,但仍是国民教育体系的薄弱环节,需要通过立法,贯彻落实党中央、国务院决策部署,破解突出问题,为学前教育高质量发展提供法治

  • 教育部办公厅关于做好“优师计划”师范生就业工作的通知

    教育部办公厅关于做好“优师计划”师范生就业工作的通知教师厅函〔2024〕22号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局,部属师范大学

  • 2024年全国精细化工行业产教融合共同体年度会议在天津召开

    中国教育报-中国教育新闻网讯(记者 陈欣然)11月6日,2024年全国精细化工行业产教融合共同体年度会议暨“校企对接”交流会在天津召开。本次大会由中国

  • 敬畏大地:石崇拜与土地祭祀

    “天”与“地”是中国传统文化中至关重要的一对意象,在崇敬天的同时,古人也深深敬畏大地。古人对石的崇拜和对土地的祭祀,便是这种敬畏之心的具体表现

  • 日榜
  • 周榜
  • 月榜