21世纪经济报道记者孔海丽 北京报道
DeepSeek低调发布了DeepSeek-V3模型的更新版本——DeepSeek-V3-0324。
没有主动传播,但引起了AI行业的一阵波澜,一个值得关注的信息点在于,该版本仍然基于V3的模型,改进训练方法后,大幅提高了推理类任务的表现水平,在数学、代码类相关评测集上取得超过GPT-4.5的得分成绩。
多维度性能改进
DeepSeek-V3-0324参数量为6850亿,较上一版本的6710亿略有增加。模型在代码、数学推理等能力上实现了提升,尤其在代码领域表现突出。在Aider的多语言基准测试中,DeepSeek-V3-0324成绩达到55%,较前代版本明显提升,成为仅次于Sonnet 3.7的非推理类模型第二名,代码能力甚至可与Claude 3.7 Sonnet相媲美。
亲民部署与开源升级
除了性能提升,DeepSeek-V3-0324在部署方面也表现出优势。该版本模型采用宽松的MIT开源协议,且可直接部署在M3 Ultra的Mac Studio上,这意味着大模型开发应用的门槛更进一步降低。苹果机器学习工程师Awni Hannun 基于MLX框架和4-bit量化,在 512GB M3 Ultra上实现了超过20 token/s的运行速度,将模型磁盘占用空间减少到352GB。
相比之前的自定义许可证,新协议还支持开发者自由修改、分发模型,支持模型蒸馏和商业化应用,进一步推动了AI技术的共享与创新。
冲击行业格局
从国内市场来看,AI领域“六小龙”在DeepSeek的冲击下出现分化。Quest Mobile1月数据显示,当月DeepSeek日活超越豆包,Kimi退居第三,月之暗面受到的冲击较为明显。而腾讯因全面拥抱DeepSeek,在基础模型领域实现追赶。
在国际市场,DeepSeek的技术突破也引发了诸多讨论。英伟达因DeepSeek的热度,股价震荡下行,投资者担忧DeepSeek的技术进步会降低市场对英伟达昂贵硬件的需求,以至于黄仁勋近日在GTC大会上特意强调:“DeepSeek带来的并不是硬件需求的减少,反而会推动对强大硬件的需求。”黄仁勋话音刚落,传来腾讯增购数十亿元芯片的消息,这些需求主要就是包括布置DeepSeek在内的大模型带来的。
与此同时,业内共识在于,DeepSeek的火爆,表明中国在基础设施软件工程等领域取得了领先地位。
此次DeepSeek-V3-0324的更新,并非市场此前期待的DeepSeek-V4或R2。但从发布时间和技术特点来看,市场猜测,DeepSeek-R2有可能在不久后上线。R2有望进一步提升模型的推理能力,持续改写AI产业的竞争格局,推动各行业智能化变革走向深入。
据英国《金融时报》网站3月13日报道,科学家们已经在利用人工智能(AI)阐释人体所谓的“黑暗基因组”,并开发一种可能很强大的癌症检测、监测和治疗新方法。美国约翰斯·霍普金斯大学的研 科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘长征八号遥三运载火箭从文昌航天发射场发射 记者3月20日来到广东深汕西高速公路改扩建施工现场,看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日,由茅以升科技教育基金会和广东省交通集团联合主办的全国高速 3月23日消息,vivo即将于3月26日发布vivo X Fold3系列折叠屏电话,其中包含vivo X Fold3和vivo X Fold3 Pro两款新品。据悉,vivo X Fold3采用了首发的碳纤维龙骨铰链,重量仅为219克,厚度为4.65毫米。相 3月25日消息,去年huawei在Mate 60系列上首发了玄武机身架构,采用一体化金属机身,搭配上超耐用锦纤材质,使整机的抗挤压能力提高10倍,使用更放心。“玄武”是极其坚固的代表,huawei还在问界M9上采用了“ 近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空 。本文链接:DeepSeek低调上新:友好度跃升http://www.sushuapos.com/show-2-11498-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。