设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

大模型增速远超摩尔定律:人类快要喂不饱AI了

2024-03-17 20:09:54 来源:

【新智元导读】近日,来自 MIT 的研究人员发表了关于大模型能力增速的研究,结果表明,LLM 的能力大约每 8 个月就会翻一倍,速度远超摩尔定律!硬件马上就要跟不上啦!gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

我们人类可能要养不起 AI 了!gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近日,来自 MIT FutureTech 的研究人员发表了一项关于大模型能力增长速度的研究,gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结果表明:LLM 的能力大约每 8 个月就会翻一倍,速度远超摩尔定律!gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文地址:https://arxiv.org/pdf/2403.05812.pdfgt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

LLM 的能力提升大部分来自于算力,而摩尔定律代表着硬件算力的发展,gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

——也就是说,随着时间的推移,终有一天我们将无法满足 LLM 所需要的算力!gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果那个时候 AI 有了意识,不知道会不会自己想办法找饭吃?gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上图表示不同领域的算法改进对有效计算翻倍的估计。 蓝点表示中心估计值或范围; 蓝色三角形对应于不同大小(范围从 1K 到 1B)的问题的倍增时间; 紫色虚线对应于摩尔定律表示的 2 年倍增时间。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

摩尔定律和比尔盖茨gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

摩尔定律(Moore's law)是一种经验或者观察结果,表示集成电路(IC)中的晶体管数量大约每两年翻一番。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1965 年,仙童半导体(Fairchild Semiconductor)和英特尔的联合创始人 Gordon Moore 假设集成电路的组件数量每年翻一番,并预测这种增长率将至少再持续十年。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1975 年,展望下一个十年,他将预测修改为每两年翻一番,复合年增长率(CAGR)为 41%。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然 Moore 没有使用经验证据来预测历史趋势将继续下去,但他的预测自 1975 年以来一直成立,所以也就成了 " 定律 "。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因为摩尔定律被半导体行业用于指导长期规划和设定研发目标,所以在某种程度上,成了一种自我实现预言。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数字电子技术的进步,例如微处理器价格的降低、内存容量(RAM 和闪存)的增加、传感器的改进,甚至数码相机中像素的数量和大小,都与摩尔定律密切相关。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数字电子的这些持续变化一直是技术和社会变革、生产力和经济增长的驱动力。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过光靠自我激励肯定是不行的,虽然行业专家没法对摩尔定律能持续多久达成共识,但根据微处理器架构师的报告,自 2010 年左右以来,整个行业的半导体发展速度已经放缓,略低于摩尔定律预测的速度。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

下面是维基百科给出的晶体管数量增长趋势图:gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

到了 2022 年 9 月,英伟达首席执行官黄仁勋直言 " 摩尔定律已死 ",不过英特尔首席执行官 Pat Gelsinger 则表示不同意。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从下图我们可以看出,英特尔还在努力用各种技术和方法为自己老祖宗提出的定律续命,并表示,问题不大,你看我们还是直线没有弯。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Andy and Bill's Lawgt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

关于算力的增长,有一句话是这样说的:" 安迪给的,比尔都拿走(What Andy giveth, Bill taketh away)"。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这反映了当时的英特尔首席执行官 Andy Grove 每次向市场推出新芯片时,微软的 CEO 比尔 · 盖茨(Bill Gates)都会通过升级软件来吃掉芯片提升的性能。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

——而以后吃掉芯片算力的就是大模型了,而且根据 MIT 的这项研究,大模型以后根本吃不饱。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究方法gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如何定义 LLM 的能力提升?首先,研究人员对模型的能力进行了量化。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基本的思想就是:如果一种算法或架构在基准测试中以一半的计算量获得相同的结果,那么就可以说,它比另一种算法或架构好两倍。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有了比赛规则之后,研究人员招募了 200 多个语言模型来参加比赛,同时为了确保公平公正,比赛所用的数据集是 WikiText-103 和 WikiText-2 以及 Penn Treebank,代表了多年来用于评估语言模型的高质量文本数据。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

专注于语言模型开发过程中使用的既定基准,为比较新旧模型提供了连续性。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

需要注意的是,这里只量化了预训练模型的能力,没有考虑一些 " 训练后增强 " 手段,比如思维链提示(COT)、微调技术的改进或者集成搜索的方法(RAG)。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

模型定义gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究人员通过拟合一个满足两个关键目标的模型来评估其性能水平:gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(1)模型必须与之前关于神经标度定律的工作大致一致;gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(2)模型应允许分解提高性能的主要因素,例如提高模型中数据或自由参数的使用效率。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这里采用的核心方法类似于之前提出的缩放定律,将 Dense Transformer 的训练损失 L 与其参数 N 的数量和训练数据集大小 D 相关联:gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中 L 是数据集上每个 token 的交叉熵损失,E、A、B、α 和 β 是常数。E 表示数据集的 " 不可减少损失 ",而第二项和第三项分别代表由于模型或数据集的有限性而导致的错误。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因为随着时间的推移,实现相同性能水平所需的资源(N 和 D)会减少。为了衡量这一点,作者在模型中引入了 " 有效数据 " 和 " 有效模型大小 " 的概念:gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中的 Y 表示年份,前面的系数表示进展率,代入上面的缩放定律,可以得到:gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过这个公式,就可以估计随着时间的推移,实现相同性能水平所需的更少资源(N 和 D)的速度。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据集gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参与测评的包含 400 多个在 WikiText-103(WT103)、WikiText-2(WT2)和 Penn Treebank(PTB)上评估的语言模型,其中约 60% 可用于分析。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究人员首先从大约 200 篇不同的论文中检索了相关的评估信息,又额外使用框架执行了 25 个模型的评估。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后,考虑数据的子集,其中包含拟合模型结构所需的信息:token 级测试困惑度(决定交叉熵损失)、发布日期、模型参数数量和训练数据集大小,最终筛选出 231 个模型供分析。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这 231 个语言模型,跨越了超过 8 个数量级的计算,上图中的每个形状代表一个模型。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

形状的大小与训练期间使用的计算成正比,困惑度评估来自于现有文献以及作者自己的评估测试。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在某些情况下,会从同一篇论文中检索到多个模型,为了避免自相关带来的问题,这里每篇论文最多只选择三个模型。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实证结果gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据缩放定律,以及作者引入的有效数据、有效参数和有效计算的定义来进行评估,结果表明:有效计算的中位倍增时间为 8.4 个月,95% 置信区间为 4.5 至 14.3 个月。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上图表示通过交叉验证选择的模型的算法进度估计值。图 a 显示了倍增时间的汇总估计值,图 b 显示了从左到右按交叉验证性能递减(MSE 测试损耗增加)排序。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上图比较了 2016 年至 2020 年前后的算法有效计算的估计倍增时间。相对于前期,后期的倍增时间较短,表明在该截止年之后算法进步速度加快。gt6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:大模型增速远超摩尔定律:人类快要喂不饱AI了http://www.sushuapos.com/show-2-3829-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 刷新历史纪录!宁德时代一年净赚超440亿:做电池没人能卷过它

下一篇: 海南男生给室友展示徒嘴剥椰子:天生血脉压制

热门资讯

  • 我国成功研制可靶向送药的磁驱软体机器人

    中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 创新中药八子补肾胶囊抗衰老研究取得重大突破

    3月20日对于我国抗衰老研究是个特殊的日子,经过近3年的不懈努力,八子补肾胶囊抗衰老取得又一重大突破。挑战人类生命极限是摆在全球科学家面前的重大

  • 专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入

  • 探月工程四期鹊桥二号中继星成功发射

    3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后,星箭分离,将鹊桥二号中继星

  • 甘肃首座特高压换流站迎来“新成员”

    3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”—&mdas

  • 培生2023年财报业绩超出预期,持续加码数字产品

    21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基

  • 原来,中国空间站里“四季如春”

    春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日

  • AI辅助诊断实现无创判定甲状腺结节良恶性

    3月21日,记者从陆军军医大学新桥医院获悉,该院普通外科开通甲乳结节AI早筛门诊,利用AI(人工智能)辅助诊断技术,成功为一名甲状腺乳头状癌患者成功实施手

  • 新研究揭示 光合作用进化“缺失的一环”

    一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进

  • 小龙虾能将锂离子转入食物链

    从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会

  • 科研团队首次揭示全国范围内蚊虫病毒组特征

    记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理

推荐资讯

  • 日榜
  • 周榜
  • 月榜