设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

发布时间: 2024-04-02 17:06:09 来源: 量子位

审稿意见“AI含量”超1/6Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

克雷西 发自 凹非寺Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIPlv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尴了个大尬!Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人们还在嘲讽有人用ChatGPT写论文忘了删掉“狐狸尾巴”,另一边审稿人也被曝出用ChatGPT写同行评论了。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而且,还是来自ICLR、NeurIPS等顶会的那种。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

来自斯坦福的学者对一些顶级AI会议(如ICLR、NeurIPS、CoRL等)中的审稿意见进行了分析,结果发现——Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在ChatGPT出现之后,这些同行评论的“AI含量”大增,最多的高达16.9%,而有ChatGPT之前这个比例大约是2%。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

证据也很直观,AI常用的词汇出现频率,在ChatGPT发布之后噌的一下就上去了。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

消息一出,Reddit的机器学习板块立刻就炸了锅,有网友直呼:闭环了!Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

在X上,也有人发出了同样的疑问:Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

既然写论文和审稿都是大模型在干,那科学家去干什么了?Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

那么,这究竟是怎么一回事呢?Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

顶会审稿意见AI含量超1/6

来自斯坦福大学多个学院以及加州大学圣芭芭拉分校的研究人员发表了一项研究,主题是关于ChatGPT对AI学术会议同行评审的影响。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究人员一共分析了ICLR、NeurIPS、CoRL和EMNLP这四个顶会中的同行评审意见,对其“AI含量”进行了计算。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • ICLR 2024: 估计α值为10.6%
  • NeurIPS 2023: 估计α值为9.1%
  • CoRL 2023: 估计α值为6.5%
  • EMNLP 2023: 估计α值为16.9%,超过了1/6

α值指在所有内容中疑似由AI生成或“显著修改”的内容所占的比例Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在ChatGPT问世之前,α值的水平大约是在2%,作为对照的Nature系列期刊评审意见的α值则未发生显著变化。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

除了得出这些数据,研究人员还发现了“AI含量”较高的评审意见大多具有一些共同特点。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从内容角度上看,“AI含量”高的意见,引用的作者中包括“et al.”的学术内容也较少Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

而且,“AI含量”高的内容,在语义上也更加同质化,比如“commendable”(值得称赞的)、“meticulous”(细致的)和“intricate”(复杂的)等形容词大量出现。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

同时作者也展示了在AI生成的内容中出现最频繁的形容词和副词各100个,下图中字号越大代表出现频率越高。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

而除了内容本身,高”AI含量“的内容的作者在行为上也表现出了一些共同之处。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一是提交的时间更加接近截止期限,特别是截止前三天提交的意见“AI含量”明显更高。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

除了提交时间晚,高“AI含量”意见的作者,普遍对自己提交的内容自信程度也更低Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评审者对自己评审意见信心水平的自我评估(满分5分)结果显示,“AI含量”较高的审稿人,自我评分也更低(不大于2分)。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝

此外,对自己的审稿意见自信程度低的另一个表现是,他们也较少对论文作者反驳做出回应Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在ICLR 2024和NeurIPS 2023上,这类审稿人中有超过12.5%从未对反驳意见做出任何回复,约10%只回复了一次。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,作者又是如何分析出这些审稿意见中的AI含量的呢?Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为此,研究人员设计了一种分布式“GPT量化”方法,能够在语料库级别有效估计AI含量,而不必逐篇分析。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,研究人员收集了已知由人类编写(ChatGPT出现前的审稿意见)和AI生成(由研究者直接用ChatGPT编写)的文本的数据集,作为参考分布。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后,作者估计了人工编写的(P)和AI生成(Q)的内容的token分布,尤其重点关注形容词的出现概率。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最后将这种分布模型拟合到未知成分的目标语料库,假设每个文档都是从人类和人工智能分布的加权组合中,即(1-α)P+αQ,并使用最大似然估计来推断α的值。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

完成方法的构建之后,研究者又合成了多组α值确定的标准数据集,并在此之上对前面提出的方法进行了验证,结果最大误差仅有2.4%。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

于是,作者使用该方法分析了最近几个会议中的审稿意见,最终得到了前面的结论。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而当这项研究被更多人所得知后,引发了广泛的讨论,其中有不少人对这种现象表达了担忧。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,也有人猜测出现这种现象的原因,可能是审稿人母语不是英语,于是用ChatGPT对英文写作进行了调整润色。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于此,有人提问到,用ChatGPT来改写而不是直接生成评论也是错的吗?Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有人给出了半肯定的答复,但理由不是关乎原创性,而是出于对文本质量的担忧,人们还是应该谨慎使用ChatGPT。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然也有人说,科学写作,本身就是ChatGPT的一种合理用途。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总之对于这件事,担忧也好宽容也罢,这种现象都已然存在了,而按照原作者的观点,这几个问题是人们应该思考的:Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 是否应该披露AI在同行评审中的使用
  • 在AI极具诱惑力的情况下,应该如何激励好的实践
  • 在人工智能同质化的境地下,人们能否保持“智力多样性”
  • 是否应该重新考虑人类/AI混合知识工作的可信度

当然了,在学术界,ChatGPT生成的内容,还远不只是审稿意见。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文作者也爱用

除了审稿人被曝用ChatGPT写评论之外,拿它来写论文的人更是屡见不鲜……Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在谷歌学术中搜索2023年及以后包含“certainly, here is”这种ChatGPT常用开头的论文,剔除直接包含“ChatGPT”和“LLM”的论文后,结果共有50余篇。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随机翻阅其中的几篇,果然是发现了ChatGPT的使用痕迹,ChatGPT在这些论文中被用做了总结、翻译、制作表格等多种用途。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

甚至其中还包括正式出版的论文合集:Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而另一个ChatGPT常用句式“As of my Last Knowledge Update”,在相同条件下的搜索结果有114条。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而且出现形式上也更加离谱,“Certainly组”当中至少还有一些只是用ChatGPT做了些辅助工作,“As of my…”这一组干脆直接拿来搞正文内容了。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,“As an AI language model, I”也有40多条搜索结果,不过也不排除其中有误伤的情况出现。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然要论离谱,可能还要属这种把ChatGPT的按钮“Regenerate Response”也一起复制进去的了,而且数量还不算少,有将近一百篇。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

露出马脚被发现的论文数量尚且如此,删去了这些关键字从而“躲过一劫”的究竟有多少,就更是不得而知了。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,并不是说研究者不能使用ChatGPT来辅助论文撰写,包括Elsevier、Springer(Nature出版商)在内的许多知名出版机构都表示并不禁止ChatGPT的使用,只要进行声明即可。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总之,无论是论文本身还是审稿意见,亦或是其他文本写作,如何以更合理的方式运用AI,值得人们继续深入思考。Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文地址:
https://arxiv.org/abs/2403.07183Plv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光储高压先进技术发布会现场。阳光电源股份有 瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬件设计铺平了道路。这项研究发表在最新一期 3月22日消息,根据huawei旗舰机型迭代策略,今年上半年将发布影像旗舰huaweiP70系列。然而,这两天一张流出的图片声称huaweiP70将于3月23日开始预售,并附有各个版本的具体售价。但据媒体报道,huawei相关 3月24日消息,今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示,huawei全新的Mate 70系列首发会搭载新的芯片,芯片的性能差不多可以比肩5.5nm,还是值得期待的。同 “啪嗒啪嗒......”一只机器狗在街上迈着规律的步伐,拉着牵引绳的盲人,在它的带领下越过沿路障碍,平稳地行走着,电子导盲犬能否取代传统导盲犬,解决视障人士一犬难求的困境?西工大团队在这方面开展 联合国政府间气候变化专门委员会(IPCC)最新发布的评估报告显示,全球温升预计在2021年至2040年内达到1.5℃。报告指出,自IPCC第五次评估报告发布以来,全球减缓气候变化的政策和法律不断增多,但实施 。

本文链接:ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝http://www.sushuapos.com/show-2-4506-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 国剧难看 春季最好华语剧《猎狼者》狠狠打脸晁然迷惑发言(春季最好华语剧猎狼者狠狠打脸晁然迷惑发言)

下一篇: 今天起,ChatGPT无需注册就能用了!

热门资讯

  • 让肺部磁共振成像从“不可看”到“看得清”

    患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情

  • 239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远

      239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • 每12个恒星或有一个吞过行星

    据《自然》20日消息称,天文学家对91对恒星所作的光谱分析显示,大约每12个恒星中就有一个可能吞噬了一个行星。在吞噬一个行星后,恒星的化学构成可能发

  • 省电“神器”是“黑科技”还是智商税?

    3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这

  • 肠道菌群关键代谢物可增强抗癌药疗效

    记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • 云海二号02组卫星发射成功

    记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任

  • 饭后想吃零食或因神经元过度活跃

    那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠

  • 1799元!红米狙击一加Ace3V 简直就是来捣乱的

    一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 科研团队首次揭示全国范围内蚊虫病毒组特征

    记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理

推荐资讯

  • 日榜
  • 周榜
  • 月榜