设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

发布时间: 来源: 量子位

AI算力8年增长1000倍1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI春晚GTC开幕,皮衣老黄再次燃爆全场。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

时隔两年,英伟达官宣新一代Blackwell架构,定位直指“新工业革命的引擎” ,“把AI扩展到万亿参数”。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

作为架构更新大年,本次大会亮点颇多:1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 宣布GPU新核弹B200,超级芯片GB200
  • Blackwell架构新服务器,一个机柜顶一个超算
  • 推出AI推理微服务NIM,要做世界AI的入口
  • 新光刻技术cuLitho进驻台积电,改进产能。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
    ……
英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

8年时间,AI算力已增长1000倍。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

老黄断言“加速计算到达了临界点,通用计算已经过时了”。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

老黄这次主题演讲题目为《见证AI的变革时刻》,但不得不说,英伟达才是最大的变革本革。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPU的形态已彻底改变

Blackwell新架构硬件产品线都围绕这一句话展开。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过芯片,与芯片间的连接技术,一步步构建出大型AI超算集群。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4nm制程达到瓶颈,就把两个芯片合在一起,以10TB每秒的满血带宽互联,组成B200 GPU,总计包含2080亿晶体管。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

没错,B100型号被跳过了,直接发布的首个GPU就是B200。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

两个B200 GPU与Grace CPU结合就成为GB200超级芯片,通过900GB/s的超低功耗NVLink芯片间互连技术连接在一起。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

两个超级芯片装到主板上,成为一个Blackwell计算节点。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

18个这样的计算节点共有36CPU+72GPU,组成更大的“虚拟GPU”。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它们之间由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接,可提供速度高达800Gb/s的网络。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

在NVLink Switch支持下,最终成为“新一代计算单元”GB200 NVL721Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一个像这样的“计算单元”机柜,FP8精度的训练算力就高达720PFlops,直逼H100时代一个DGX SuperPod超级计算机集群(1000 PFlops)。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

与相同数量的72个H100相比,GB200 NVL72对于大模型推理性能提升高达30倍成本和能耗降低高达25倍1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

把GB200 NVL72当做单个GPU使用,具有1.4EFlops的AI推理算力和30TB高速内存。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

再用Quantum InfiniBand交换机连接,配合散热系统组成新一代DGX SuperPod集群。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DGX GB200 SuperPod采用新型高效液冷机架规模架构,标准配置可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外还支持增加额外的机架扩展性能。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

最终成为包含32000 GPU的分布式超算集群。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

老黄直言,“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

将提供无与伦比的规模、可靠性,具有智能管理和全栈弹性,以确保不断的使用。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

在演讲中,老黄还特别提到2016年赠送OpenAI的DGX-1,那也是史上第一次8块GPU连在一起组成一个超级计算机。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

从此之后便开启了训练最大模型所需算力每6个月翻一倍的增长之路。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

GPU新核弹GB200

过去,在90天内训练一个1.8万亿参数的MoE架构GPT模型,需要8000个Hopper架构GPU,15兆瓦功率。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

如今,同样给90天时间,在Blackwell架构下只需要2000个GPU,以及1/4的能源消耗。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

Blackwell架构除了芯片本身外,还包含多项重大革新:1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 第二代Transformer引擎

动态为神经网络中的每个神经元启用FP6和FP4精度支持。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速
  • 第五代NVLink高速互联

为每个GPU 提供了1.8TB/s双向吞吐量,确保多达576个GPU之间的无缝高速通信。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速
  • Ras Engine(可靠性、可用性和可维护性引擎)

基于AI的预防性维护来运行诊断和预测可靠性问题。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • Secure AI

先进的加密计算功能,在不影响性能的情况下保护AI模型和客户数据,对于医疗保健和金融服务等隐私敏感行业至关重要。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 专用解压缩引擎

支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

在这些技术支持下,一个GB200 NVL72就最高支持27万亿参数的模型1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而GPT-4根据泄露数据,也不过只有1.7万亿参数。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

英伟达要做世界AI的入口

老黄官宣ai.nvidia.com页面,要做世界AI的入口。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

任何人都可以通过易于使用的用户界面体验各种AI模型和应用。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,企业使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

这上面的应用都由英伟达全新推出的AI推理微服务NIM支持,可对来自英伟达及合作伙伴的数十个AI模型进行优化推理。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

此外,英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问,用于检索增强生成 (RAG)、护栏、数据处理、HPC 等。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

比如通过这些微服务,可以轻松构建基于大模型和向量数据库的ChatPDF产品,甚至智能体Agent应用。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

NIM微服务定价非常直观,“一个GPU一小时一美元”,或年付打五折,一个GPU一年4500美元。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从此,英伟达NIM和CUDA做为中间枢纽,连接了百万开发者与上亿GPU芯片。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

什么概念?1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

老黄晒出AI界“最强朋友圈”,包括亚马逊、迪士尼、三星等大型企业,都已成为英伟达合作伙伴。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

最后总结一下,与往年相比英伟达2024年战略更聚焦AI,而且产品更有针对性。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如第五代NVLink还特意为MoE架构大模型优化通讯瓶颈。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

新的芯片和软件服务,都在不断的强调推理算力,要进一步打开AI应用部署市场。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然作为算力之王,AI并不是英伟达的全部。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这次大会上,还特别宣布了与苹果在Vision Pro方面的合作,让开发者在工业元宇宙里搞空间计算。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

此前推出的新光刻技术cuLitho软件库也有了新进展,被台积电和新思科技采用,把触手伸向更上游的芯片制造商。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

当然也少不了生物医疗、工业元宇宙、机器人汽车的新成果。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

以及布局下一轮计算变革的前沿领域,英伟达推出云量子计算机模拟微服务,让全球科学家都能充分利用量子计算的力量,将自己的想法变成现。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

One More Thing

去年GTC大会上,老黄与OpenAI首席科学家Ilya Sutskever的炉边对谈,仍为人津津乐道。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当时世界还没完全从ChatGPT的震撼中清醒过来,OpenAI是整个行业绝对的主角。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如今Ilya不知踪影,OpenAI的市场统治力也开始松动。在这个节骨眼上,有资格与老黄对谈的人换成了8位——1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Transformer八子,开山论文《Attention is all you need》的八位作者。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他们陆陆续续已经悉数离开谷歌,其中7位投身AI创业,有模型层也有应用层,有toB也有toC。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这八位传奇人物既象征着大模型技术真正的起源,又代表着现在百花齐放的AI产业图景。在这样的格局中,OpenAI不过是其中一位玩家。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而就在两天后,老黄将把他们聚齐,在自己的主场。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

要论在整个AI界的影响力、号召力,在这一刻,无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman,恐怕都比不过眼前这位“皮衣客”黄仁勋。1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

……1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

直播回放:
https://www.youtube.com/watch?v=Y2F8yisiS6E1Zd速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据阿根廷布宜诺斯艾利斯经济新闻网报道,一项国际研究发现,阿尔茨海默病的早期症状可能表现在视力上。研究显示,即便眼科检查结果正常,但阅读、估计距离和触及物体的困难都是可能揭示阿尔茨海默病 荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈该病带来新希望。相关研究论文将提交于4月27 据中国科学院武汉植物园消息,我国科研人员在大别山区开展植物多样性科学考察时,发现了天门冬科天门冬属新物种,并将其命名为大别山天门冬。相关研究成果日前发表在国际知名植物分类学期刊《植物 造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫力低下、记忆下降、脱发、皮肤松弛等。北京 3月23日消息,vivo即将于3月26日发布vivo X Fold3系列折叠屏电话,其中包含vivo X Fold3和vivo X Fold3 Pro两款新品。据悉,vivo X Fold3采用了首发的碳纤维龙骨铰链,重量仅为219克,厚度为4.65毫米。相 记者从中国气象局了解到,3月24日、25日和26日三天,将可能出现地磁活动,其中3月25日可能发生中等以上地磁暴甚至大地磁暴,预计地磁活动将持续到26日。在此影响之下,空间站可能因大气拖拽造成轨道高 。

本文链接:英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速http://www.sushuapos.com/show-2-4207-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 全球首个类Sora开源复现方案来了!全面公开训练细节和模型权重

下一篇: 亚信科技公布2023全年业绩 三新业务继续保持双位数增长

热门资讯

  • 未来,政企深度用云需要一朵怎样的“云”?

    随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业

  • 量子计算机能更好解决组合优化问题

    旅行推销员问题是一个经典的数学问题,也是一个组合优化问题。德国柏林弗雷大学和亥姆霍兹柏林能源与材料研究中心(HZB)科学家开展的一项新研究证明,量

  • 马斯克开源3140亿参数的Grok,大模型争相开源所为何求?

      马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯

  • 海龟深潜时一分钟心跳只有两次

    据《日本经济新闻》3月19日报道,东京大学副教授坂本健太郎等人研究发现,海龟下潜时心率将急剧下降。海龟与鲸等哺乳类动物同样,心率随下潜深度加深而

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • AI辅助诊断实现无创判定甲状腺结节良恶性

    3月21日,记者从陆军军医大学新桥医院获悉,该院普通外科开通甲乳结节AI早筛门诊,利用AI(人工智能)辅助诊断技术,成功为一名甲状腺乳头状癌患者成功实施手

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 潜望长焦缺席三代后 曝xiaomi15 Pro重新拥抱潜望镜头

    3月22日消息,数码闲聊站爆料称,xiaomi15 Pro将采用5000万像素的超大底三摄方案,其中一颗是全新的潜望长焦镜头。据资料显示,xiaomi11 Pro配备了潜望长焦镜

  • 站在“气候行动最前线”,我们该如何行动?

    联合国政府间气候变化专门委员会(IPCC)最新发布的评估报告显示,全球温升预计在2021年至2040年内达到1.5℃。报告指出,自IPCC第五次评估报告发布以来,全

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜