5月15日,京东探索研究院论文《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》发表于《Nature》旗下期刊《npj Artificial Intelligence》,该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法,成为国内首个系统性解决开放环境下大模型开发效率难题并获国际顶刊认证的研究成果。
该技术通过模型蒸馏、数据治理、训练优化与云边协同四大创新,将大模型推理效率平均提升30%,训练成本降低70%,为大模型规模化落地提供了可复用的技术范式。
京东大模型开发计算技术,推理平均提效30%
企业将大模型应用付诸实践,面临着诸多卡点,一方面进入大模型应用门槛高,另一方面模型训练与推理效率低。
京东大模型开发计算技术,能支持企业的模型开发训练及生产,让庞大、重型的AI模型“瘦身”成精悍的小模型,精华依旧,效率大增,瘦身不降智。既能节省算力资源,加速推理,还能适应多平台,广泛部署到更多平台上。
论文中提出了四个创新方法:
・模型蒸馏,采用动态分层蒸馏技术,特别是在预训练阶段进行蒸馏,调整仅0.5%的参数实现低资源场景下的高效训练,减少大型模型的部署成本。
・数据治理,提出跨领域数据动态采样算法,自动混合不同领域数据,并引入隐私保护和主动学习技术,提升大模型泛化能力。
・训练优化,使用贝叶斯优化(BO)框架进行超参数优化和架构搜索,尤其是擅长处理离散空间,MPMD场景下资源利用率提升40%。
・云边协同,支持在云端进行模型搜索和训练,边缘设备负责部署和推理,并利用两阶段压缩策略以适应资源限制,提升云边协作的高效性。
值得一提的是,该平台还可支持京东大模型、Llama、DeepSeek等多个模型的蒸馏、推理。在模型蒸馏层面,效果较同量级模型有明显提升,以京东大模型为例,蒸馏后的大模型Livebench提升14分。大量的实验结果也证明有效性和效率,推理平均提效30%,训练成本平均降低70%。
JoyBuild大模型开发计算平台,让模型训练与应用更普惠
这套京东沉淀下来的大模型开发计算的技术,支撑了JoyBuild大模型开发计算平台,广泛服务行业用户。
JoyBuild能够为客户的大模型开发和行业应用开发,提供定制化解决方案。JoyBuild支持各类模型的调优开发,内置20余种开源模型和丰富的数据集,并提供100余种算法和工具链,帮助企业根据自身业务特征,将通用模型迅速转化为专业模型,一站式应用大模型。
现在,不到一周时间,企业即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。
京东丰富的业务场景,还为平台上的基础大模型提供具体的行业应用场景,加速基于大模型的商业化落地。在行业知识库之外,JoyBuild沉淀了京东自己的零售、物流、健康、金融等行业Know-How,可应用于供应链优化、智能客服、营销内容生成等各类场景,加速模型普惠。
京东给出的大模型解法并不是“黑箱”,而是一条解决大模型训练效率及应用问题的通用路径,是真正的“授之以渔”,对学术界、产业界均有广泛参考价值。未来,京东将进一步提升大模型开发与计算效率,让中小型和大型企业都能低成本、高效构建专属AI应用,助推AI规模化应用落地。
中新经纬1月11日电 (林琬斯)近日,有传闻称资生堂中国裁员40%。11日,资生堂中国回应中新经纬称,相关传言与事实不符。 资生堂中国表示,资生堂中国于2024年开始实施新的品牌组合战略以夯实业务基础。相应地,内部也正 中新经纬1月11日电 农业农村部种植业管理司消息,2023年12月中旬以来冷空气活动频繁,中东部大部地区气温低于常年同期,蔬菜生长受阻,生产管理成本增加,蔬菜地头价环比上涨较多,但随着寒潮天气过程结束,近期蔬菜价格趋于平 “年轻人报复性挤爆3.5分餐厅” 砸了谁的锅 不能仅靠年轻人“挤爆3.5分餐厅”的一身反骨,而要靠净化网络平台信用环境、提升完善评价体系 有一句流行语“股票反着买,别墅靠着海”,意思是要拒绝从众心理,反向操 多家A股公司积极布局视频生成模型赛道 本报记者 郭冀川 丁 蓉 继ChatGPT这一现象级的应用推出一年之后,近日,美国开放人工智能研究中心OpenAI正式发布了旗下首款视频生成模型Sora,再次在全球掀起了人工智能关 新国标实施一周年 中国婴配乳粉注册工作取得成效 中新社北京2月22日电 (记者 刘亮)记者22日从中国国家市场监管总局获悉,自婴幼儿配方食品新国标(以下称新国标)发布实施后,中国婴幼儿配方乳粉(以下称婴配乳粉)产 中新经纬2月22日电 据国家市场监督管理总局网站消息,自新国标发布实施后,婴幼儿配方乳粉(以下称婴配乳粉)产品配方按新国标注册攻坚工作进展顺利,截至目前,共计1127个配方通过注册。 市场监管总局表示,婴幼儿配方食 。本文链接:京东大模型开发计算研究登《Nature》子刊,支持企业大模型蒸馏与开发应用http://www.sushuapos.com/show-5-56014-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 一季度黄金全产业链观察报告:避险属性主导黄金价格变动
下一篇: 招商银行原副行长丁伟被提起公诉