技术突破驱动成本下降多款国产大模型宣布降价

发布时间: 2026-06-18 11:25:19 来源：证券日报

观看：3

近期，DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API（应用程序编程接口）调用费用，多款主流模型降价幅度突破90%。

有行业分析师对《证券日报》记者表示，大模型API价格的接连下探，本质上是技术红利释放与市场竞争博弈共振的结果。一方面，底层模型架构的不断迭代与推理系统效能的深度挖掘，正推动单位词元（Token）的计算成本实现阶梯式下降，为价格体系的重塑提供了底层支撑；另一方面，白热化的市场角逐进一步加速了这一进程，使得降价成为厂商在激烈竞争中抢占身位的现实选择。

降价动作频频

本轮国产大模型降价周期集中在5月下旬至6月中旬，降价力度逐层加码，接连打破全球商用大模型API底价纪录。

5月22日，DeepSeek率先启动调价，其旗下旗舰级通用大模型V4-Pro开启永久性降价，整体降幅达到75%；依托缓存加速技术，该模型输入侧缓存命中单价跌至0.025元/百万词元，成为当前全球公开报价最低的顶级能力大模型。

仅仅5天后，小米紧随其后完成调价动作，其旗下MiMo-V2.5全系列API接口永久下调资费，部分细分调用场景降价比例逼近99%，成为本轮降价潮中单次降幅最高的厂商。

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告，明确自6月3日起，平台内上线的DeepSeek-V4全系列模型同步下调调用价格，最高降幅达到97.5%。腾讯云同时强调，本次调整仅修改计费标准，模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动，用户使用体验不受影响。

腾讯云后续还在6月12日推出第二轮差异化调价，覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro，输入词元计费下调66.67%、输出词元计费下调55.56%；针对第三方入驻模型MiniMax-M3，则设定延后调价节点，定于6月15日统一下调推理输入、推理输出、缓存命中三项费用，各项降幅均为50%。

值得关注的是，本轮降价完全背离上游算力市场走势。2026年上半年，AI硬件供应链供需矛盾持续激化，核心存储部件HBM（高带宽内存）半年内市价涨幅超500%，英伟达高端GPU（图形处理器）现货长期供不应求，海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价，部分海外厂商API最高涨幅甚至达到463%。

一涨一跌的反向走势，让国产大模型的竞争策略差异彻底凸显。

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示，国内大模型行业已经走完前期烧钱试错的技术验证阶段，全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言，本次大范围降价直接降低AI创业试错成本。在预算不变的前提下，团队可调用的模型词元总量能够提升数倍至近百倍，原本受资金限制无法落地的轻量化AI工具、行业定制插件，如今具备了商业化测试条件，小众创新团队的生存空间得到明显拓宽。

多重因素形成支撑

抛开市场竞争因素，业内人士普遍认为，多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破，是厂商能够逆势降价的核心支撑，上游硬件涨价的压力已经被推理层技术优化所对冲。

小米官方披露了MiMo模型的降本技术路径：研发团队基于SGLang（结构化生成语言）框架配套HiCache（配套高速）缓存方案，完整兼容滑动窗口注意力（SWA）算法。通过重构词元缓存调度逻辑，将KV（键值）缓存在GPU显存、CPU（中央处理器）内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7，同时把系统可长效缓存的词元容量提升5倍。除此之外，团队还优化了混合专家模型的并行调度逻辑，新增输入文本长度分桶匹配策略，解决了超长文本并发调用时集群算力浪费问题，集群整体吞吐效率提升后，单词元的平均推理成本自然下降。

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面，自研轻量化稀疏注意力机制搭配动态混合专家结构，让V4系列模型处理十万级至百万级超长上下文时，算力资源消耗仅为上一代版本的27%，KV缓存显存占用直接压缩90%；算力适配层面，该模型完成了昇腾系列国产算力芯片的深度底层适配，摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本，另一方面也补齐了国产算力生态的商用落地案例，实现技术与成本双向收益。

张毅表示，未来大模型价格将呈现两极分化走势：基础推理服务价格因技术迭代和规模效应持续下探，逐步接近公用事业定价；而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建，具备自主架构创新能力和国产算力适配能力的企业有望胜出，缺乏技术护城河的厂商将面临出清压力。

近期，DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API（应用程序编程接口）调用费用，多款主流模型降价幅度突破90%。

有行业分析师对《证券日报》记者表示，大模型API价格的接连下探，本质上是技术红利释放与市场竞争博弈共振的结果。一方面，底层模型架构的不断迭代与推理系统效能的深度挖掘，正推动单位词元（Token）的计算成本实现阶梯式下降，为价格体系的重塑提供了底层支撑；另一方面，白热化的市场角逐进一步加速了这一进程，使得降价成为厂商在激烈竞争中抢占身位的现实选择。

降价动作频频

本轮国产大模型降价周期集中在5月下旬至6月中旬，降价力度逐层加码，接连打破全球商用大模型API底价纪录。

5月22日，DeepSeek率先启动调价，其旗下旗舰级通用大模型V4-Pro开启永久性降价，整体降幅达到75%；依托缓存加速技术，该模型输入侧缓存命中单价跌至0.025元/百万词元，成为当前全球公开报价最低的顶级能力大模型。

仅仅5天后，小米紧随其后完成调价动作，其旗下MiMo-V2.5全系列API接口永久下调资费，部分细分调用场景降价比例逼近99%，成为本轮降价潮中单次降幅最高的厂商。

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告，明确自6月3日起，平台内上线的DeepSeek-V4全系列模型同步下调调用价格，最高降幅达到97.5%。腾讯云同时强调，本次调整仅修改计费标准，模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动，用户使用体验不受影响。

腾讯云后续还在6月12日推出第二轮差异化调价，覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro，输入词元计费下调66.67%、输出词元计费下调55.56%；针对第三方入驻模型MiniMax-M3，则设定延后调价节点，定于6月15日统一下调推理输入、推理输出、缓存命中三项费用，各项降幅均为50%。

值得关注的是，本轮降价完全背离上游算力市场走势。2026年上半年，AI硬件供应链供需矛盾持续激化，核心存储部件HBM（高带宽内存）半年内市价涨幅超500%，英伟达高端GPU（图形处理器）现货长期供不应求，海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价，部分海外厂商API最高涨幅甚至达到463%。

一涨一跌的反向走势，让国产大模型的竞争策略差异彻底凸显。

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示，国内大模型行业已经走完前期烧钱试错的技术验证阶段，全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言，本次大范围降价直接降低AI创业试错成本。在预算不变的前提下，团队可调用的模型词元总量能够提升数倍至近百倍，原本受资金限制无法落地的轻量化AI工具、行业定制插件，如今具备了商业化测试条件，小众创新团队的生存空间得到明显拓宽。

多重因素形成支撑

抛开市场竞争因素，业内人士普遍认为，多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破，是厂商能够逆势降价的核心支撑，上游硬件涨价的压力已经被推理层技术优化所对冲。

小米官方披露了MiMo模型的降本技术路径：研发团队基于SGLang（结构化生成语言）框架配套HiCache（配套高速）缓存方案，完整兼容滑动窗口注意力（SWA）算法。通过重构词元缓存调度逻辑，将KV（键值）缓存在GPU显存、CPU（中央处理器）内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7，同时把系统可长效缓存的词元容量提升5倍。除此之外，团队还优化了混合专家模型的并行调度逻辑，新增输入文本长度分桶匹配策略，解决了超长文本并发调用时集群算力浪费问题，集群整体吞吐效率提升后，单词元的平均推理成本自然下降。

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面，自研轻量化稀疏注意力机制搭配动态混合专家结构，让V4系列模型处理十万级至百万级超长上下文时，算力资源消耗仅为上一代版本的27%，KV缓存显存占用直接压缩90%；算力适配层面，该模型完成了昇腾系列国产算力芯片的深度底层适配，摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本，另一方面也补齐了国产算力生态的商用落地案例，实现技术与成本双向收益。

张毅表示，未来大模型价格将呈现两极分化走势：基础推理服务价格因技术迭代和规模效应持续下探，逐步接近公用事业定价；而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建，具备自主架构创新能力和国产算力适配能力的企业有望胜出，缺乏技术护城河的厂商将面临出清压力。

随着历史的车轮驶入2024年，大模型、AIGC等话题引发广泛热议，云计算与AI技术展现出了前所未有的深度融合趋势，就如同寒武纪的生物大爆发，激发着各行各业的创新浪潮。新质生产力时代到来，政企用云进美国布朗大学研究团队在最新一期《自然·电子学》上描述了一种无线通信网络。它可有效地传输、接收和解码来自数千个微电子芯片的数据。研究团队试图模仿大脑神秘且高效的工作方式。对 3月22日黎明，太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴，上演“结伴游”。北京星空摄影爱好者王俊峰2023年1月23日在北京西城区拍摄的金星（左上）、土星记者3月20日从中国科学技术大学获悉，该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局最优自适应策略，并发展了自适应集体测量实验 3月23日消息，京东与OPPO战略合作协议签约仪式举行，双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上，OPPO高级副CEO、首席产品官刘作虎表示，2024年线上突破是OPPO中国区 “啪嗒啪嗒......”一只机器狗在街上迈着规律的步伐，拉着牵引绳的盲人，在它的带领下越过沿路障碍，平稳地行走着，电子导盲犬能否取代传统导盲犬，解决视障人士一犬难求的困境？西工大团队在这方面开展。

本文链接：技术突破驱动成本下降多款国产大模型宣布降价http://www.sushuapos.com/show-2-16563-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：一束“光”照进智造产业

下一篇：超表面元件让太阳磁场测量“一气呵成”

技术突破驱动成本下降多款国产大模型宣布降价

热门资讯

推荐资讯

科技最热文章

技术突破驱动成本下降 多款国产大模型宣布降价

热门资讯

推荐资讯

科技最热文章

技术突破驱动成本下降多款国产大模型宣布降价