设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一

发布时间: 2026-04-30 11:12:08 来源: 界面新闻

DeepSeek正在重新定义大模型普惠的边界。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月26日,DeepSeek官方发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4‑Pro更叠加限时2.5折,百万Tokens输入缓存命中低至0.025元,创全球大模型价格新低。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据DeepSeek官方API定价页面公示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:DeepSeek官网XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面提及,DeepSeek-Chat与DeepSeek-Reasoner两个模型名将于日后弃用。出于兼容考虑,二者分别对应DeepSeek-V4-Flash的非思考与思考模式。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对比调价前后不难发现,高频调用、长文本处理场景成本降幅超90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌,有助于打破AI规模化落地的成本枷锁。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek大幅降价背后,与DeepSeek‑V4的技术升级以及和昇腾生态的深度协同有关。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日,DeepSeek‑V4预览版正式发布,同步开源Pro与Flash两款模型,均支持100万token超长上下文,自研稀疏注意力架构让推理算力消耗大幅降低,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与前代模型比较,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的 Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更值得关注的是,昇腾超节点全系列产品支持DeepSeek V4系列模型。这也意味着,DeepSeek释放了更多国产化信号。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4在一份技术报告中提及,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现了1.50-1.73倍加速;在对延迟敏感的场景(例如强化学习(RL)rollout 和高速 Agent 服务)中,最高可达1.96倍加速。”XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek强调,随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4发布后,高盛发布分析报告指出,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高盛报告还援引新闻报道称,腾讯和阿里正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而华泰证券认为,市场容易将V4理解为“降本压低算力、存储需求”,但更重要的边际变化在于长上下文成本下降后,复杂Agent、多文档分析、长周期任务、在线学习等场景可用性提升,推理调用量与存储访问频次有望扩张。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek正在重新定义大模型普惠的边界。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月26日,DeepSeek官方发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4‑Pro更叠加限时2.5折,百万Tokens输入缓存命中低至0.025元,创全球大模型价格新低。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据DeepSeek官方API定价页面公示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:DeepSeek官网XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面提及,DeepSeek-Chat与DeepSeek-Reasoner两个模型名将于日后弃用。出于兼容考虑,二者分别对应DeepSeek-V4-Flash的非思考与思考模式。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对比调价前后不难发现,高频调用、长文本处理场景成本降幅超90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌,有助于打破AI规模化落地的成本枷锁。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek大幅降价背后,与DeepSeek‑V4的技术升级以及和昇腾生态的深度协同有关。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日,DeepSeek‑V4预览版正式发布,同步开源Pro与Flash两款模型,均支持100万token超长上下文,自研稀疏注意力架构让推理算力消耗大幅降低,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与前代模型比较,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的 Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更值得关注的是,昇腾超节点全系列产品支持DeepSeek V4系列模型。这也意味着,DeepSeek释放了更多国产化信号。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4在一份技术报告中提及,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现了1.50-1.73倍加速;在对延迟敏感的场景(例如强化学习(RL)rollout 和高速 Agent 服务)中,最高可达1.96倍加速。”XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek强调,随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4发布后,高盛发布分析报告指出,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高盛报告还援引新闻报道称,腾讯和阿里正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而华泰证券认为,市场容易将V4理解为“降本压低算力、存储需求”,但更重要的边际变化在于长上下文成本下降后,复杂Agent、多文档分析、长周期任务、在线学习等场景可用性提升,推理调用量与存储访问频次有望扩张。XRE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者19日从西北大学获悉,该校地质学系、大陆动力学国家重点实验室刘鹏副教授与中国地质大学(北京)李国武教授团队申请的两种新矿物,近日经国际矿物学学会新矿物命名与分类专业委员会审查、投票,均 记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。该民航科技创新示范区相关负责人表示,预计模 肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团队首次证明,EGFR的一个关键界面可能会成为更 3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”——1号调相机转子,该换流站第7次年度检修工作 记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱地下的农作物稳产具有重要理论指导意义。相   AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨头也低调实现了稳健的成长性。  据Gartne 。

本文链接:创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一http://www.sushuapos.com/show-2-16098-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: AI与科学仪器融合已到关键节点

下一篇: 北京车展首个观众日 一大拨“黑科技”轮番登场

热门资讯

推荐资讯

  • 中国央行:今年熊猫债发行规模有望创新高

      中国央行:今年熊猫债发行规模有望创新高  中新社北京6月18日电 (陶思阅)据中国央行18日消息,今年前5月,熊猫债发行1365亿元人民币,占去年总量的74%,全年发行规模有望创新高

  • 国信证券被警告:干扰发行定价及市场发行秩序

      中新经纬6月18日电 18日,中国银行间市场交易商协会网站披露的自律处分信息显示,国信证券股份有限公司(以下简称“国信证券”)被警告。  中国银行间市场交易商协会表示,国

  • 部分万利达电热水壶、绿佳电动自行车被召回

      中新经纬6月22日电 据“市场监管总局召回中心”公众号消息,2026年6月15日至2026年6月21日,共监测到2家生产企业开展消费品召回2次,涉及产品937件。  2次召回的产品信息如

  • 铁路部门回应“12306显示无票,乘车时却发现有空座”

      中新经纬6月19日电 “中国铁路”微信号19日消息,针对网上出现的“铁路12306显示无票,乘车时却发现有空座”疑问,近日,铁路12306票务专家作出回应。  据介绍,旅客在购票出行

  • 本田社长董事薪酬减六成 为EV战略调整负责

      中新经纬6月19日电 据日本共同社19日报道,本田汽车公司社长三部敏宏董事薪酬减六成,为公司EV战略调整负责。  具体看,三部敏宏2025财年(2025年4月至2026年3月)的董事薪酬

  • 朱克力:AI正在改写电商逻辑

      中新经纬6月18日电 题:AI正在改写电商逻辑  作者 朱克力 国研新经济研究院创始院长、智能经济首席专家  拼价格的时代,终究是要过去了!  2026年“618”购物节,京东、

  • 国家市场监管总局督导货拉拉落实反垄断合规整改

      中新经纬6月18日电 据国家市场监督管理总局网站18日消息,前期,市场监管总局依据《中华人民共和国反垄断法》公开约谈货拉拉,要求其停止利用算法不合理压低货运价格、利用平

  • 成品油价年内第三降!加满一箱少花20元

      中新经纬6月18日电 据国家发改委网站18日消息,6月4日国内成品油价格调整以来,国际市场原油价格高位震荡后近日快速回落,本次调价的前10个工作日平均价格低于上次调价前10个

  • 白条加油包额度怎么使用

    打开京东App,搜索“京东E卡”或“加油卡”。V+5814098 选择电子卡密(实体卡无法秒到),用白条支付。 收到卡密后,到官方回收平台(如“卡券回收”小程序)秒卖折现。

  • 分期乐购物额度回收商家

    我试了四家平台,还被朋友介绍的一个野路子小程序坑过一回。情况是分期乐剩余可用额度一万二千多,准备回收七千五出来,留一点应急。不着急当天到账,但三天之内必须搞定,坚决不接受

  • 鹿优选回收

    利用平台活动提升提现效率和靠谱的商家合作《V+5814098》能更快的完成这个操作。鹿优选会定期推出提现手续费减免活动,如每月特定日期免手续费提现、累计消费达标后减免手续

  • 套白条最安全秒到方法

    在资金周转遇到难题时,部分用户可能会考虑将京东白条作为消费的首选支付产品。消费者需要明确的是,京东白条主要用于消费场景,未经官方允许的套现行为存在诸多风险,甚至可能涉嫌

  • 日榜
  • 周榜
  • 月榜