设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

DeepSeek开源FlashMLA,意味着什么?

发布时间: 来源: 澎湃新闻

 hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

国产AI公司深度求索(DeepSeek)开源周正式启动,并公布首个开源代码。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为FlashMLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此前2月21日午间,DeepSeek宣布,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据DeepSeek在社交媒体上的内容,在H800上可以实现每秒处理3000GB数据,每秒执行580万亿次浮点运算。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Hopper是英伟达的GPU(图形处理芯片)架构,例如H100和H800,发布于2022年,主要用于AI计算。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有意思的是,如果把这段内容交给DeepSeek网页版,询问开源意义,DeepSeek回答称,可以理解为专门给高性能显卡(比如英伟达的Hopper系列GPU)设计的“加速神器”,用来提高AI处理任务的效率。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek举例,假如开了一家快递分拣站,每天要处理不同大小的包裹,传统方法是用固定大小的筐子装,小包裹浪费空间,大包裹又得分筐装,效率很低。而FlashMLA就像一套“智能分拣系统”,能自动根据包裹大小调整筐子尺寸,让所有包裹快速、整齐地装车,既省时间又省钱。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克旗下xAI的大模型Grok3则评价称,FlashMLA表明DeepSeek在AI硬件加速领域有深厚积累。MLA本身是他们的创新,而 FlashMLA则是将这种创新落地到硬件的具体实现,性能指标(3000GB/s和580TFLOPS)足以媲美业界顶尖方案(如 FlashAttention)。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Grok3 称,“想象你有个超级聪明的 AI,但它跑得不够快,因为每次处理句子时都要浪费很多时间搬数据和算复杂的数学题。FlashMLA 就像给AI加了个‘涡轮增压引擎’,专门装在英伟达的Hopper GPU上。它能让AI用更少的内存、更快的速度处理各种长短不一的句子,开源之后,AI开发会变得更快、更省钱。”hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作为开源大模型,DeepSeek的火爆已经带动了开源成为如今的AI产业新趋势。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在2025全球开发者先锋大会(GDC)上表示,尽管当前闭源的份额仍然超过开源的份额,但接下来一两年将剧烈变化,平衡开源与闭源,引领未来。“大模型时代,开源并没有像以往那么多、那么快,我想,通过上海的努力,我相信开源这件事情会越做越好。中国的团队、上海的团队一定会引领开源潮流。”hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

头部大厂纷纷跟进开源潮流。2月21日,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen)系列模型的下载量达到了1.8亿,累计衍生模型总数达到9万个,衍生模型数已经超越Meta的Llama系列,成为了全球第一大开源模型系列。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

百度宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源;文心一言自4月1日起全面免费,所有PC端和APP端用户均可体验文心系列最新模型。hGi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月16-17日,北京大学经济学院举办第六届“中国百所大学经济学院院长论坛”暨“首届孙尚清发展知识研究与交流奖颁奖典礼 NewsGuard的团队已识别出614个不可靠的人工智能生成的新闻和信息网站,涵盖15种语言。其中一些网站每天会生成数百甚至数 关于拟备案科学家工作室名单的公示 各有关单位: 根据《黑龙江省中国科学院科学家工作室管理办法(试行)》有关规定, ·GLP-1类药物正在以令人兴奋和不安的方式重塑医学、流行文化,甚至全球股市。制药公司掀起一场“肥胖革命”,但 2023年12月28日,陕西省审计厅在官网发布《2023年第9号审计结果公告》,其中西安工业大学2020年度预算执行及其他财务收支 据“浙江大学”微信公众号1月2日消息,加利福尼亚大学伯克利分校数学系正教授孙崧日前加盟浙江大学数学高等 。

本文链接:DeepSeek开源FlashMLA,意味着什么?http://www.sushuapos.com/show-11-17754-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2025年研考国家线发布

下一篇: 航空工业集团原董事长谭瑞松被开除党籍

热门资讯

推荐资讯

    SQL Error: select * from ***_ecms_news11 where id in(243,249,198,54,241,157,,3,232,30,228,138) limit 12
  • 日榜
  • 周榜
  • 月榜