设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

用AI生成数据训练AI或导致模型崩溃,原始内容9次迭代后成了“胡言乱语”

发布时间: 来源: 中国科技网

《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练AI模型的重要性。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

包括英国牛津大学在内的联合团队一直在进行相关研究,并在去年论文预印本中提出这一概念。在正式发表的论文中,他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现,给模型输入AI生成的数据,会减弱今后几代模型的学习能力,最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型,都容易出现问题。比如,一个用中世纪建筑文本作为原始输入的测试,到第9代的输出已经是一串野兔的名字。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队指出,用前几代生成的数据集去训练AI,崩溃是一个不可避免的结局。他们认为,必须对数据进行严格过滤。与此同时,这也意味着依赖人类生成内容的AI模型,或许能训练出更高效的AI模型。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总编辑圈点:1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对AI来说,“模型崩溃”就像癌症一样,甚至分早期与晚期。在早期时,被“喂”了生成数据的AI会开始失去一些原始正确数据;但在晚期,被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实,也和底层数据一点不相关的结果,就像本文中的例子一样。更可怕的是,“模型崩溃”的AI极其固执,错误几乎难以矫正。它会持续强化,最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕,因为它等于是在“毒化”AI对真实世界的认知。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练AI模型的重要性。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

包括英国牛津大学在内的联合团队一直在进行相关研究,并在去年论文预印本中提出这一概念。在正式发表的论文中,他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现,给模型输入AI生成的数据,会减弱今后几代模型的学习能力,最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型,都容易出现问题。比如,一个用中世纪建筑文本作为原始输入的测试,到第9代的输出已经是一串野兔的名字。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队指出,用前几代生成的数据集去训练AI,崩溃是一个不可避免的结局。他们认为,必须对数据进行严格过滤。与此同时,这也意味着依赖人类生成内容的AI模型,或许能训练出更高效的AI模型。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总编辑圈点:1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对AI来说,“模型崩溃”就像癌症一样,甚至分早期与晚期。在早期时,被“喂”了生成数据的AI会开始失去一些原始正确数据;但在晚期,被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实,也和底层数据一点不相关的结果,就像本文中的例子一样。更可怕的是,“模型崩溃”的AI极其固执,错误几乎难以矫正。它会持续强化,最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕,因为它等于是在“毒化”AI对真实世界的认知。1IV速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制。这项研究系统阐明了ASFV感染的细胞嗜性、 记者从中国科学院金属研究所获悉,该所沈阳材料科学国家研究中心胡卫进研究员与合作者,提出利用缓冲层定量调控薄膜应变,延迟铁电薄膜晶格弛豫从而增强铁电极化强度的策略,成功揭示极化强度同铁电 荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈该病带来新希望。相关研究论文将提交于4月27 3月25日消息,国内一场经济高峰论坛上,iPhone总裁蒂姆·库克再次成为焦点。然而,引起人们关注的并非库克的讲话内容,而是一张自拍照片。在论坛现场,一位观众与库克自拍合影,但引人注目的是她手中 3月24日是第29个世界防治结核病日,我国的宣传主题是“你我共同努力,终结结核流行”。在北京大学社会化媒体研究中心21日举办的“技术升级,加速我国终结结核流行进程”主题沙龙上,中国疾控中心结 近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空 。

本文链接:用AI生成数据训练AI或导致模型崩溃,原始内容9次迭代后成了“胡言乱语”http://www.sushuapos.com/show-2-7711-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 新研究证实禽流感会在哺乳动物间传播

下一篇: 极干旱沙漠10年来首开鲜花

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜