DeepSeek的爆火出圈为国产芯片同时带来了机会与挑战。一方面,新锐模型和AI原生应用的爆发会产生更多算力需求,但同时,由于国产芯片在底层架构和软件生态上的差异,如何高效适配AI模型并充分发挥算力潜力成为国产芯片领域亟待解决的问题。
近日,北京电子数智科技有限责任公司(以下简称“北电数智”)依托其“宝塔·模型适配平台”成功完成DeepSeek V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等多款国产芯片的混元算力适配,为开发者和企业提供了更灵活、高效的算力支持。
技术创新:DeepSeek模型性能领先
DeepSeek模型作为国产AI技术的代表,采用了多项创新技术,包括混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架。这使DeepSeek在大幅减少算力开销的情况下实现了R1模型与OpenAI o1相当、V3模型与OpenAI 4o相当的性能表现,展现出高推理效率和低训练成本的优势。
宝塔·模型适配平台:抹平芯片差异,异构算力高效支撑模型
北电数智“宝塔·模型适配平台”抹平了不同芯片架构的差异,快速实现对DeepSeek模型的优化支持和硬件适配。用户无需关注底层硬件技术细节,平台会根据模型调用需求自动匹配合适的算力资源,大幅降低了开发门槛。目前,该平台已完成24款基座大模型的适配工作,为开发者提供了更多算力选择。
混元推理技术:优化效率,降低成本
针对DeepSeek类超大模型的推理任务,数据中心的集群化推理技术显得尤为重要,例如PD分离(Prefill-Decode分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与DeepSeek的技术路线高度契合,能有效解决算力不足问题,为大规模AI应用创造便利条件。
推动国产算力发展:从适配到生态建设
DeepSeek的发展为行业带来了深刻启示:只有满足国产原生模型的算力需求,才能真正推动包含国产算力在内的中国AI产业发展。为全面挖掘国产芯片性能潜力与适配能力,北电数智还推出了“星火·国产算力AI原生适配认证”,促进国产模型与国产算力的深度融合,推动国产芯片在AI原生应用场景中的迭代与创新。
企业版内测上线:助力AI应用落地
目前,北电数智已正式开通企业版内测服务,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力支持。无论是模型训练还是推理任务,用户都可以在多芯混元算力环境下轻松构建和部署基于DeepSeek模型的AI应用。
北电数智的一系列举措,为国产AI芯片与模型的协同发展提供了新思路。未来,随着更多企业和开发者加入,国产算力生态也将迎来更加广阔的发展空间。
中新经纬1月12日电 中国饭店协会、中国旅游饭店业协会、中国循环经济协会、中国消费者协会12日联合发文,倡议住宿业减少一次性塑料用品使用。 倡议称:一、深刻认识住宿业在塑料污染治理中的社会责任,高度重视塑料 25省份出台预制菜发展标准 上下游行业等待“国标”出台 预制菜行业进入发展的快车道。 从2020年开始,预制菜概念逐渐走入大众视野,市场规模不断扩大。截至2022年,预制菜市场规模已突破4000亿元。到了2023年,政 中新经纬2月19日电 近日,大连万达集团股份有限公司(下称万达集团)新增一则股权冻结信息,其所持近5亿股权被冻结。 国家企业信用信息公示系统网站显示,万达集团被冻结的股权数额为49999.877万元,执行法院为甘肃矿区 【隔夜重磅】 特朗普“带货”卖鞋,一双399美元 据美联社18日消息,美国前总统唐纳德・特朗普近日突然出现在费城会议中心,并推销一款特朗普品牌球鞋,这双鞋定价399美元(约合2800元人民币),被命名为“永不言败高帮 国家移民管理局:春节假期1351.7万人次出入境 同比增长2.8倍 中新网2月18日电 据国家移民管理局微信公众号消息,2024年春节假期全国边检机关共保障1351.7万人次中外人员出入境,日均169万人次,较2023年春节同期增长2 新华社济南2月22日电(记者陈国峰、张钟仁)连日来,山东多地迎来大风降温和雨雪天气。21日,受降雪影响,济南西站部分列车降速运行,出现晚点情况。售票大厅内,记者看到“晚点停运车次退票”窗口前排起长龙。国 。本文链接:北电数智助力DeepSeek与国产芯片适配,加速AI应用落地http://www.sushuapos.com/show-5-47282-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。