DeepSeek发布模型更新，新版本编程能力大大提升

发布时间: 2025-03-26 10:38:16 来源：澎湃新闻

观看：81

3月24日晚间，杭州深度求索人工智能基础技术研究有限公司（以下简称“深度求索”）发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新，并非市场此前一直期待的DeepSeek-V4或R2。目前已在Hugging Face上开源，并迅速登上了Trending榜单。据悉，其开源版本模型体积为6850亿参数。

同日，DeepSeek在其官方交流群宣布称，DeepSeek V3模型已完成小版本升级，该版本的最新模型也已经同步至官网、App 和小程序，关闭“深度思考”就可体验。

此次发布的版本更新，在性能上，编程能力的优化成了最大亮点，新版本DeepSeek-V3-0324生成前端代码的能力大大提升。

不少自媒体博主在社交平台上发帖认为，DeepSeek-V3-0324 模型在前端代码的生成能力上有了质的提升，审美方面也提升了不少，甚至有博主测评称可以媲美 Claude 3.7 Sonnet思维链版本。有不少用户开始尝试将新模型与此前发布的模型结合解锁新的玩法。有用户称用DeepSeek-V3-0324 模型尝试编写了800多行代码，整个过程没有出现任何故障。“这是免费的、开源的、超快的。很高兴看到这些开源模型如何向大型科技公司施压，以更低的成本构建更好的模型。”该位用户称。

澎湃科技此前曾报道，初代DeepSeek-V3发布于2024年12月26日晚间，这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露，DeepSeek-V3模型的总训练成本为557.6万美元，而GPT-4o等模型的训练成本约为1亿美元。深度求索表示，“这是一个全新的开始。”其后，DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型，该模型在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

今天上午，中国首家公办本科职业学校——南京工业职业技术大学与柬埔寨柬华理事总会合作共建的柬华应用科技大学成立揭牌 ? 2023年12月14日，自然科学基金委化学科学部在北京召开会议，对2017年度资助的国家自然科学基金创新研究群体项目进 12月17日，由中国科学院大学马克思主义学院、中国科学院大学党史党建研究中心主办的“纪念毛泽东同志诞辰130周年学术研讨 12月19日，第二届中国气象旅游产业发展大会在河南三门峡召开。来自中国旅游研究院、中国气象局公共气象服务中心、中国科郭永怀、李佩、王承书、王希季、邓稼先、王淦昌、钱骥……一串令人肃然起敬的名字，在中国科学院大学（以下简称国科大）师生 “科学探索奖”5周年之后再出发。作为目前国内金额最高的青年科技人才资助计划之一，第六届“科学探索。

本文链接：DeepSeek发布模型更新，新版本编程能力大大提升http://www.sushuapos.com/show-11-19010-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：北大新增工学部、信息科学与技术学部负责人已定

下一篇： AI生成内容标识是良性生态发展的基础

DeepSeek发布模型更新，新版本编程能力大大提升

热门资讯

推荐资讯

科学最热文章