设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

直面大模型“大成本”挑战,如何提高算力效率?

2024-06-03 17:31:44 来源:

  直面大模型“大成本”挑战,如何提高算力效率?GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力代价、能源代价同样巨大。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有业界技术团队测算,若要对一个5000亿参数规模的单体大模型进行充分训练,所需算力基础设施约在10亿美元规模,每年消耗的电费在5.3亿元人民币。无论对于哪个机构、企业,这都是天文数字和巨大代价,中国也不例外。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  知名科学杂志《Nature》此前发表了一篇关于大模型未来发展之路的文章,《In Al, is bigger always better?》(人工智能,越大型越好?)。争议的出现,意味着AI发展方向出现了分歧。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,“大”不再是模型的唯一追求,计算效率和算力开销两大问题成为新的行业焦点。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  MoE大模型的盛行,实际上对应的正是模型能力和算力开销两大问题的解决。这也是为何众多大模型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。“这可能是中国发展自己的AI大模型比较行之有效的路径。”GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他直言,大模型推进速度越来越快,必须强调模型算力效率。“大家可以想象,效率越高就意味着在单位算力投入相等的情况下获得的精度回报越高,它对于训练和应用都非常有利。”GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “现实的算力是有限的,我们一再反复强调模算效率,试图针对当前算力情况闯出一条自己觉得比较好的路子。在固定每个Token算力不变的情况下,通过扩展专家数量可以获得更大参数量的模型,进而获得更高精度。”吴韶华说。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他进一步称,整体来看,尽管当前模型的能力提升非常之快,但之前大家更多关注单个维度问题,即平均精度的提升。但大模型进入快速落地时代,就不得不考虑更多维度的问题,包括模算效率、精度、算力开销等。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中国工程院院士郑纬民曾做过这样的计算,在大模型训练过程中,70%开销要花在算力上;推理过程中95%的花费也是在算力上。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为解决大模型训练的算力不足问题,郑纬民建议,在推动智能计算中心建设同时也可以利用已有超算系统的空余算力。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  郑纬民表示,现有14个国家挂牌的超算系统,每台机器的建设成本都很高,成本在10亿元至20亿元,甚至更高。这些超算系统已经为中国的国民经济发展作出巨大贡献,但有些系统还有空余算力,这些空余算力也可被用来做大模型训练,且经过优化甚至可降低大模型训练成本。GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于近期中国企业的一轮大模型降价,零一万物CEO李开复表示,未来整个行业的推理成本每年降低十倍是可以期待的,且这个趋势是必然的,如此会有更多人用上大模型,这是非常利好的消息。(完)GaA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:直面大模型“大成本”挑战,如何提高算力效率?http://www.sushuapos.com/show-5-17209-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 知名品牌上新仅10多天,大批小学生家长被娃缠着买它:感觉被“绑架”了,又贵又占时间

下一篇: 南京:立案查处二手空调违规翻新

热门资讯

  • 人工智能客服不能阻碍沟通

      人工智能客服不能阻碍沟通  AI客服的理想与现实总是存在落差。我们当然希望AI客服能更“聪明”一些。但在此之前,企业不应过分依赖AI客服,而该给消费者多一个选项。  

  • 直播招聘平台用户规模已超2.5亿,人社部发文推广直播带岗

      直播招聘平台用户规模已超2.5亿,人社部发文推广直播带岗  直播带货不新奇,但你知道“直播带岗”吗?  在网络直播间,主播们正在向求职者们介绍着新的岗位,屏幕上求职者们

  • 增值税发票数据显示:春节假期中国服务消费火热

      增值税发票数据显示:春节假期中国服务消费火热  中新社北京2月18日电 (记者 赵建华)中国国家税务总局18日公布的增值税发票数据显示,今年春节假期(正月初一至初八)中国

  • 春节假期中国民航运输旅客创历史新高

      春节假期中国民航运输旅客创历史新高  中新社北京2月18日电 (记者 刘文文)记者18日从中国民航局获悉,2024年春节假期(2月10日―2月17日)民航市场平稳有序运行,全国民航

  • 傅园慧称在长白山包车被勒索 当地交通部门:正按流程处理

      傅园慧称在长白山包车被勒索 当地交通部门:正按流程处理  中新网北京2月17日电(记者 刘星晨)17日,游泳世界冠军傅园慧通过社交平台发布求助帖称,她在吉林长白山包车出行

  • 平台数据显示春节中国游客足迹遍布全球1700多个城市

      平台数据显示春节中国游客足迹遍布全球1700多个城市  中新社北京2月17日电 (记者 刘亮)中国在线旅游平台去哪儿17日发布的数据显示,今年春节假期中国游客足迹遍布全球1

  • 牵住“牛鼻子” 京津冀协同发展迈向更高水平

    “首都南大门”保定,中创燕园在这里新扩建的厂房已完成装修,北京大学物理学院的专家每周都前来开展研发工作,这是“北京研发,保定落地”的一个缩影;海河

  • 海口秀英出台楼宇经济扶持政策 最高奖励300万元

    中国经济导报、中国发展网讯 为加快构建“一区三圈四园”产业发展新格局,发挥商务楼宇安商引商的引擎作用,2月21日,《海口市秀英区促进楼宇经济高质量发展扶

  • 江西千方百计拓宽农民工就业渠道

    新华社南昌2月22日电(记者刘佳敏)“江西银河表计有限公司招普工50名,薪资大约4200至4800元。这个公司离立新很近,你有空可以去参观一下。”近日,在九江市永修县

  • 湖北:应急响应升级 保畅保电提速

    新华社记者王自宸、宋立崑、侯文坤受大范围低温雨雪冰冻天气影响,至22日5时,湖北省绝大部分市县出现1至9厘米积雪。湖北省应急部门于22日10时将低温雨雪冰冻

  • 杏林春暖 百姓安康

    北京朝阳小红门社区卫生服务中心春节守“医线”不打烊本报记者 | 王春华2月13日,大年初四的早上7点半,北京市朝阳区小红门社区卫生服务中心二楼的一处诊室内,

  • 甘肃成县:务虚求实明方向 凝心聚力鼓干劲

    中国经济导报 中国发展网讯 2月20日,龙年春节热闹欢乐的氛围还未散去,甘肃成县就以开局就是决战的干劲、起步就是冲刺的拼劲的崭新面貌召开2024年工作务虚会,

推荐资讯

  • 国内首个“国际化友好景区”共建计划在黄山启动

      近日,国内首个“国际化友好景区”共建计划在黄山启动。据悉,该计划由中国人民银行黄山市分行、黄山风景区管委会等部门共同指导和支持,由支付宝、黄山旅游股份有限公司率先

  • 投资14.4亿元,山东江泉文旅城·琅琊梦工厂项目签约

      近日,在2024山东省文旅产业高质量发展大会上,罗韵文化旅游发展集团有限公司与浙江浙旅投资有限责任公司签订江泉文旅城·琅琊梦工厂项目战略合作协议。据悉,该项目计划总投

  • 四川多个景区官宣免门票优惠政策

      “五一”假期即将到来。近期,四川多个景区官宣了“劳模”免票政策.    九寨沟景区  2024年5月1日至5月5日,对持有地市州及以上人民政府颁发的“劳动模范”证书、政

  • 程十发的魔幻现实主义山水

    上海海派艺术馆推出的“梅柳渡江春——程十发书画艺术作品展”中,有他晚年精心创作的山水画。记得在上世纪八十年代初,当我在程十发先生的

  • 大连万达商管2023年营收523.25亿元,酒店运营业务收入上升77.88%

    近日,大连万达商业管理集团股份有限公司发布公司债券年度报告。报告期内,大连万达商管营业收入从493.14亿元提升至523.25亿元,毛利率62.21%。其中,酒店运营业务收入上升77.88%,成

  • 香港迪士尼乐园:本季将招聘500人,起薪点连津贴在18000港元以上

      据香港电台网站报道,香港迪士尼将于5月8日及9日举行招聘会,提供500个全职职位,主要涵盖乐园服务岗位,也包括娱乐事务技术、乐园营运、零售及餐饮职位。现场设有前线营运团队

  • 浙江杭州拟发布有关保障性住房新政

      近日,杭州市政府网站发布关于《杭州市保障性住房配售管理办法(试行)》(征求意见稿),向全社会公开征求意见。  《配售管理办法》共31条,包括总则、定价和供应、申请和审核、售

  • 青岛福楼安可傲途格精选酒店开业

    近日,青岛福楼安可傲途格精选酒店正式开业,它是品牌在国内的第四家分号,以“音乐之岛”为主题诠释青岛魅力。酒店位于青岛市崂山区海龙路12号,紧临青岛海滨风景区、极地海洋世界

  • 企查查:去年文旅相关企业注册量同比增长53.77%

      去年以来,国内文旅热度只增不减,众人纷纷踏出家门,在阳光或霓虹灯下置身人海,感受久违的市井烟火。但在体验过人海的热闹和城市的喧嚣之后,人们对文旅的热情不知觉进入了第二

  • 马尔克斯的魔幻现实主义95%是现实

    遗作《我们八月见》的出版,让已经离开十年的加西亚·马尔克斯重回公众的视线。因病魔缠身,加西亚·马尔克斯计划中的自传《活着为了讲述

  • 时间与桑皮纸 亦敌亦友

    夜已深,窗外未静。寄居近处,灯火通明,南北向的一条马路,车流不息属常态。喇叭声时起,烧烤味不时飘来,兼有婴儿啼哭声、家长督学的呵斥声。所谓写作,只能见

  • KKR计划将14家日本酒店改造为万豪福朋喜来登酒店,预计下半年开业

    5月8日,睿思网消息,KKR宣布,计划将其近期收购的14家日本酒店改造成万豪国际旗下的中档品牌——福朋喜来登快捷酒店 (Four Points Express by Sheraton),预计将于2024年下半年开

  • 日榜
  • 周榜
  • 月榜
    SQL Error: select * from ***_ecms_news11 where id in(113,140,199,,247,9,28,46,74,175,261,41) limit 12