设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

发布时间: 来源: 量子位

大智若愚了还是大于弱智了?OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据??OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

没错,论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的:OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

其他平台围观网友也纷纷蚌埠住。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

作者之一也现身评论区,透露使用弱智吧数据训练AI属于灵机一动,以前只用来测试。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

弱智吧数据究竟如何达成这一成就,具体到论文中看。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智发言成指令微调神器

这项研究起初为解决中文大模型训练中的诸多问题OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 中文数据集很多是从英文翻译过来的,没有很好地契合中文的语言习惯和文化背景
  • 不少数据集是用AI生成的,质量难以保证,容易出现事实性错误
  • 即使是人工标注的数据集,也存在数据量小、覆盖领域不全面等问题

为了解决这些痛点,团队从中文互联网的各种知识源头直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的清洗和人工审核,打造成高质量、多样化的中文指令微调数据集COIG-CQIAOnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了探索不同数据源的作用,团队还专门从中抽取出一个精华子集CQIA-SubsetOnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在众多数据来源中,弱智吧成了最特别的一个。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由500个点赞最高的帖子标题+人工或GPT-4的回复组成指令微调数据集, 经过人工审核后,最终留下了240组指令-回复数据对。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

分别用各种数据集训练零一万物Yi系列开源大模型,在BELLE-Eval测试集上使用GPT-4评分得到结果。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在规模较小的Yi-6B模型上,纯弱智吧版本总分排名第三,还不算太突出。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

看来小模型还没能领悟弱智的精髓。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

到了Yi-34B,弱智吧版本表现就一骑绝尘了。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

只有在改写和数学任务上没能取得最高分,但成绩也比较靠前。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另外,在安全评估上弱智吧版本也能排上第二。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

对于这类现象,研究人员在分析中也给出简单猜测:OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当然弱智吧并不是这项研究的全部,它的真正贡献在于为中文大模型开发提供了一个高质量的指令微调数据集COIG-CQIA。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

通过对各种中文互联网数据源的探索,这项研究为构建中文指令数据集提供了很多有益的启示。比如社交媒体数据虽然开放多样,但也存在不少有害信息风险;而百科类数据专业性强,但覆盖面可能不够广。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧上大分

这项研究一发,网友集体笑不活。除了“XSWL、思路开阔了”婶儿的纯围观,也有网友认真讨论起了弱智吧有如此奇效的原因。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大伙儿都比较认可的一个原因是弱智吧题目的“异质”。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

像脑筋急转弯,增加了指令多样性,所以提升了模型最终性能:OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另一个原因是弱智吧数据文本质量很高,用词准确且简洁OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

千言万语汇成一句话:把弱智吧只当简单的段子合集真的是严重低估了它的价值!OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

雀食,要不此前弱智吧问题也经常被大伙儿用来测试大模型呢。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

事实上从ChatGPT诞生之初,弱智吧就深度参与了大模型的发展,可以算是这一波AI浪潮的重要见证者了。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一开始只是网友拿来拷打AI,搞搞节目效果。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后来大家发现,弱智吧问题中充满陷阱,刚好可以用来分辨AI能力高低。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还记得23年初那会儿,各家大模型第一版还不太能很好应对这类问题,如2023年3月的文心一言:OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后续版本也渐入佳境了,如2023年8月的文心一言:OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

知道今天,弱智吧问题都是每个新发布大模型都必须要过的一关,被戏称为弱智吧Benchmark。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

秘塔写作猫OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

InspoOnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再后来,AI公司们自己也开始重视起来,如百度官方就搞过联动直播。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当初网友为了调戏大模型专门搜集的弱智吧问题测试集,没想到有一天也能摇身一变,成了训练集。OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

思路确实是被打开了~OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

论文地址:
https://arxiv.org/abs/2403.18058OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:
[1]https://x.com/9hills/status/1775358963724554410OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://zhuanlan.zhihu.com/p/690640864OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://tieba.baidu.com/p/8964992247OnL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈该病带来新希望。相关研究论文将提交于4月27 英国科学家首次创造了一个新颖的实验平台,即“量子龙卷风”。它能模拟超流体氦中的黑洞,使研究人员能更详细地观察类似黑洞的行为以及与周围环境的相互作用。通过对超流体氦表面微波动力学的观 记者3月19日从天津大学获悉,该校环境学院刘庆岭教授团队与吉林大学于吉红院士团队以及天津工业大学梅东海教授团队合作,证明了无有机模板剂合成的具有OFF和ERI拓扑共生结构的Cu-T催化剂具有优 联合国机构3月20日发布的《全球电子垃圾监测》报告显示,2022年全球范围内共产生6200万吨电子垃圾,其中仅有不到四分之一被回收利用。报告显示,2022年全球电子垃圾的产生量相比2010年增长了82%。 从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会2024年春季会议上展示的一项研究成果,描述了 记者从中国科学院新疆天文台获悉,近期南山26米射电望远镜在参与欧洲VLBI网组织的联测中,首次成功运用4Gbps宽带、高码率VLBI技术获得干涉条纹。相较于2Gbps观测,该技术理论上可将图像信噪比提升 。

本文链接:弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一http://www.sushuapos.com/show-2-4574-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 峰会报名中|第二波嘉宾已就位,距离4月17日仅有两周

下一篇: 腾讯开源视频生成新工具,论文还没发先上代码的那种

热门资讯

  • 人工智能探究癌症发展机理

    据英国《金融时报》网站3月13日报道,科学家们已经在利用人工智能(AI)阐释人体所谓的“黑暗基因组”,并开发一种可能很强大的癌症检测、监测和治疗新

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 省电“神器”是“黑科技”还是智商税?

    3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • AI辅助诊断实现无创判定甲状腺结节良恶性

    3月21日,记者从陆军军医大学新桥医院获悉,该院普通外科开通甲乳结节AI早筛门诊,利用AI(人工智能)辅助诊断技术,成功为一名甲状腺乳头状癌患者成功实施手

  • “认知选择”或影响人类语言演化

    人类的语言自产生以来,就不断演化发展。发音、词汇、语法的演变过程,是语言学家较为关注的领域。语言演化的根本动力是什么,演化又呈现出怎样的规律?我

  • xiaomiCivi 4 Pro首发第三代骁龙8s:性能、影像、AI等拉满!xiaomi自此全员旗舰

    xiaomi在3月21日正式发布了首款“潮流旗舰”定位的产品——xiaomiCivi 4 Pro。该机定位相较以前大幅升级,尤其是性能、影像、AI方面明显提高,

  • 首款骁龙8 Gen3折叠屏!vivo X Fold3图赏

    3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供

  • 京东与OPPO重磅合作:销售额3年翻倍!

    3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产

  • 库克:苹果头显产品年内中国上市!产业链核心供应商揭秘

    3月24日,据央视财经消息,在今天开幕的中国发展高层论坛2024年年会现场,苹果公司首席执行官蒂姆·库克回应记者提问表示,苹果公司的Apple Visio

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜