设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

发布时间: 2024-04-04 16:48:07 来源: 量子位

大智若愚了还是大于弱智了?6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据??6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

没错,论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的:6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

其他平台围观网友也纷纷蚌埠住。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

作者之一也现身评论区,透露使用弱智吧数据训练AI属于灵机一动,以前只用来测试。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

弱智吧数据究竟如何达成这一成就,具体到论文中看。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智发言成指令微调神器

这项研究起初为解决中文大模型训练中的诸多问题6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 中文数据集很多是从英文翻译过来的,没有很好地契合中文的语言习惯和文化背景
  • 不少数据集是用AI生成的,质量难以保证,容易出现事实性错误
  • 即使是人工标注的数据集,也存在数据量小、覆盖领域不全面等问题

为了解决这些痛点,团队从中文互联网的各种知识源头直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的清洗和人工审核,打造成高质量、多样化的中文指令微调数据集COIG-CQIA6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了探索不同数据源的作用,团队还专门从中抽取出一个精华子集CQIA-Subset6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在众多数据来源中,弱智吧成了最特别的一个。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由500个点赞最高的帖子标题+人工或GPT-4的回复组成指令微调数据集, 经过人工审核后,最终留下了240组指令-回复数据对。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

分别用各种数据集训练零一万物Yi系列开源大模型,在BELLE-Eval测试集上使用GPT-4评分得到结果。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在规模较小的Yi-6B模型上,纯弱智吧版本总分排名第三,还不算太突出。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

看来小模型还没能领悟弱智的精髓。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

到了Yi-34B,弱智吧版本表现就一骑绝尘了。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

只有在改写和数学任务上没能取得最高分,但成绩也比较靠前。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另外,在安全评估上弱智吧版本也能排上第二。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

对于这类现象,研究人员在分析中也给出简单猜测:6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当然弱智吧并不是这项研究的全部,它的真正贡献在于为中文大模型开发提供了一个高质量的指令微调数据集COIG-CQIA。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

通过对各种中文互联网数据源的探索,这项研究为构建中文指令数据集提供了很多有益的启示。比如社交媒体数据虽然开放多样,但也存在不少有害信息风险;而百科类数据专业性强,但覆盖面可能不够广。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧上大分

这项研究一发,网友集体笑不活。除了“XSWL、思路开阔了”婶儿的纯围观,也有网友认真讨论起了弱智吧有如此奇效的原因。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大伙儿都比较认可的一个原因是弱智吧题目的“异质”。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

像脑筋急转弯,增加了指令多样性,所以提升了模型最终性能:6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另一个原因是弱智吧数据文本质量很高,用词准确且简洁6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

千言万语汇成一句话:把弱智吧只当简单的段子合集真的是严重低估了它的价值!6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

雀食,要不此前弱智吧问题也经常被大伙儿用来测试大模型呢。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

事实上从ChatGPT诞生之初,弱智吧就深度参与了大模型的发展,可以算是这一波AI浪潮的重要见证者了。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一开始只是网友拿来拷打AI,搞搞节目效果。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后来大家发现,弱智吧问题中充满陷阱,刚好可以用来分辨AI能力高低。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还记得23年初那会儿,各家大模型第一版还不太能很好应对这类问题,如2023年3月的文心一言:6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后续版本也渐入佳境了,如2023年8月的文心一言:6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

知道今天,弱智吧问题都是每个新发布大模型都必须要过的一关,被戏称为弱智吧Benchmark。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

秘塔写作猫6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

Inspo6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再后来,AI公司们自己也开始重视起来,如百度官方就搞过联动直播。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当初网友为了调戏大模型专门搜集的弱智吧问题测试集,没想到有一天也能摇身一变,成了训练集。6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

思路确实是被打开了~6HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

论文地址:
https://arxiv.org/abs/2403.180586HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:
[1]https://x.com/9hills/status/17753589637245544106HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://zhuanlan.zhihu.com/p/6906408646HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://tieba.baidu.com/p/89649922476HI速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据法新社3月18日报道,周一,美国半导体巨头英伟达公司发布了其最新型号的电子芯片,这些芯片旨在支持人工智能(AI)革命,英伟达正努力巩固其作为人工智能领域关键供应商的地位。“我们需要更加强大的 据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道,在人工智能(AI)迅速重新定义就业格局的今天,通常被称为“软”技能的人类技能成为最有韧性、最有价值的技能。这是阿尼什·拉曼和玛丽亚&mi 今年1月,英国分子生物学家肖尔托·戴维发表文章,指控美国哈佛大学医学院附属丹娜-法伯癌症研究所科学家通过修改图片伪造数据。随后该研究所正式宣布撤回6篇论文,并纠正了另外31篇论文的 再打一局游戏就睡,再刷几个视频就睡,终于放下手机,关灯睡觉了……结果翻来覆去睡不着,半夜醒来再也睡不着,为什么明明睡着了,睡眠质量却不高?3月21日是世界睡眠日,最新发布的《2024中国 2024年03月19日,以“初心如磐•向新出发”为主题的2024智能家居UP峰会CSHIA智能家居开年盛典在杭州成功举行。大会现场,由全国专业标准化技术委员会委员、CSHIA秘书长、中智盟投资创始人周 3月22日,中国互联网络信息中心(CNNIC)在京发布第53次《中国互联网络发展状况统计报告》。报告显示,截至2023年12月,我国网民规模达10.92亿人,互联网普及率达77.5%;网络基础设施建设持续加强,新型消费 。

本文链接:弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一http://www.sushuapos.com/show-2-4574-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 峰会报名中|第二波嘉宾已就位,距离4月17日仅有两周

下一篇: 腾讯开源视频生成新工具,论文还没发先上代码的那种

热门资讯

  • 明天氢能荣获国家电网科技进步奖一等奖

    记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为

  • 50000台套!西北首条小型风冷氢燃料电池电堆全自动化生产线即将投产

    日前,盛世盈创氢能科技(陕西)有限公司(以下简称盛世盈创)与协氢(上海)新能源科技有限公司宣布达成战略合作,共同推进风冷氢燃料电池电堆全自动化生产线(以下

  • 研究发现神经系统疾病成人类健康主要“杀手”

    据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成

  • 肺癌蛋白质致命弱点发现

    肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团

  • 最小资源消耗的量子态分辨实现

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优

  • 科学新发现丨有史以来最大的三维宇宙地图发布

    根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地

  • 我科学家实现最小资源消耗的量子态分辨

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局

  • AI+智能家居赋能健康睡眠

    3月21日是第二十五个“世界睡眠日”,中国睡眠研究会联合慕思集团在北京正式发布《2024情绪与健康睡眠白皮书》(以下简称《白皮书》)。《白皮书》指出,

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • 新研究揭示 光合作用进化“缺失的一环”

    一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

  • 第三颗“厦门造”卫星出征

    3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门

推荐资讯

  • 日榜
  • 周榜
  • 月榜