设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

20万颗GPU“烧出”Grok3:业界称“大力出奇迹”仍可行,算力仍是护城河

发布时间: 2025-02-25 10:50:07 来源:

  20万颗GPU“烧出”Grok3:业界称“大力出奇迹”仍可行,算力仍是护城河yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Grok 3表明依靠算力堆积的“大力出奇迹”路径目前依旧可行。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2月18日,特斯拉创始人埃隆・马斯克旗下xAI推出最新大模型Grok 3。据介绍,虽然Grok起步较晚,但MMLU(大规模多任务语言理解基准测试)得分已追上ChatGPT,Grok 3和轻量化的Grok 3 mini在多个性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Grok 3在xAI位于孟菲斯的Colossus超算中心进行训练。xAI透露,这一超算中心的算力已经翻倍,拥有的英伟达GPU数量已达到20万颗。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  本以为是马斯克又在虚张声势,但这次Grok 3的确没有令人失望。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  基于Grok 3的优秀表现,不少业内人士再度表露了对算力堆积这种“大力出奇迹”路径的认可。更有分析人士指出,Grok 3证明了缩放法则(scaling law)在达到上限之前仍有发展空间――这对整个行业来说是一个令人鼓舞的信号。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  AI大牛、前OpenAI 研究员、前特斯拉AI负责人Andrej Karpathy在成为Grok 3首批用户后,在社交媒体上发布了一份详细的测评总结。他称赞了Grok 3 的逻辑推理能力,并指出其性能可与OpenAI的o1-pro模型相媲美,后者的月度费用为200美元。他还认为,Grok 3的推理能力略优于DeepSeek-R1、谷歌的Gemini 2.0 Flash Thinking。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,他也指出了Grok 3的一些局限性,包括搜索功能DeepSearch中偶尔出现的幻觉和事实错误。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “考虑到该团队大约1年前才从零开始,这真是令人难以置信,他们以前所未有的速度达到了几乎业内最高水平。”Karpathy表示。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不少科技领域的分析人士表明,Grok 3的成功,在很大程度上就是依靠算力堆积。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  人工智能服务网站Maginative创始人兼主编Chris McKay认为,xAI自成立以来,仅用了一年多的时间就迅速开发出了具有竞争力的AI技术,其成功很大程度上得益于创新的计算基础设施和对大量计算资源的访问。随着更多超算集群的规划,xAI似乎有望继续提升模型能力。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  沃顿商学院人工智能教授Ethan Mollick认为Grok 3完全符合预期。他指出,人工智能仍在加速发展,速度和算力都是护城河,“人才和芯片就是打造前沿模型的公开秘诀”。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “护城河可能不深,但足以淹死初创企业。”雪城大学公共传播学院教授、咨询公司The Palmer Group首席执行官Shelly Palmer评论说。在他看来,Grok 3的护城河“已经被金钱填满”。英伟达H100 GPU的价格在3万至4万美元之间,即使马斯克拿到了折扣,这仍然是一项30亿到50亿美元的庞大投资。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  公开信息显示,OpenAI训练GPT-4用了大约2.5万张A100 GPU,而H100的训练吞吐量远高于A100;据DeepSeek公布的信息,DeepSeek-V3模型预训练费用仅为557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上耗时55天完成。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  随着DeepSeek的横空出世,不少人提出缩放法则(scaling law)可能会失效或者不再完全适用。缩放法则是AI研究中的一个重要指导原则,它认为,在大多数情况下,增加规模(模型参数、数据量、算力)都能提高模型的表现,但效益递减。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  科技领域博主Zain Kahn表示,近几个月来,有观点认为,向大模型投入更多数据和算力将不再奏效,但Grok 3证明了这种怀疑并不正确。xAI才进入这个领域两年,就已经与顶尖公司展开了激烈竞争,甚至击败了顶尖公司。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Kahn强调说,xAI庞大的Colossus超算集群将大模型推向了新的高度,“预训练缩放法则在达到上限之前仍有发展空间――这对整个行业来说是一个令人鼓舞的信号。”yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  机构也对算力的作用给出了肯定,指出算力堆积仍是模型进步的关键变量。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  华泰证券在2月20日发布的研报中提出,Grok 3证明预训练在算力提升下仍能突破。虽然目前在预训练数据上存在瓶颈,但是合成数据、RL(强化学习)数据、工程能力优化,甚至Transformer架构迭代,或能逐步打破瓶颈,Grok 3已经证明预训练依然有突破空间。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  国泰君安也提到,xAI算力资源储备与开源策略的平衡,凸显算力与算法的同等重要性。高昂的算力投入已经形成了显著的技术门槛。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中信证券指出,Grok 3作为全球首个在十万卡集群上训练的大模型,综合能力较前代模型Grok 2提升显著,意味着算力堆积仍是模型进步的关键变量之一。yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者 吴遇利yMM速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然不同的选择。3月17日,马斯克宣布开源Grok-1,这 记者3月21日从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。该滤波器件安装于传统无标记光学显微镜后,可采集到单个纳米 3月23日消息,据最新爆料,vivo X100s Pro已经获得3C认证,估计 会在5月份前后发布。该机可以看做是vivo X100 Pro的小迭代机型,属于半代升级款,与去年X90s类似。新机从此前的天玑9300升级为天玑9300+,处 3月22日,中国互联网络信息中心(CNNIC)在京发布第53次《中国互联网络发展状况统计报告》。报告显示,截至2023年12月,我国网民规模达10.92亿人,互联网普及率达77.5%;网络基础设施建设持续加强,新型消费 3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门航天卫星应用领域商业化、产业化发展更进一 在近日开幕的中国国际核工业展览会上,中国核学会理事会党委书记、理事长王寿君表示,中国内地现有在运核电机组55台、居全球第三;在建核电机组26台,保持全球第一。这些成绩的取得,离不开智能化技术 。

本文链接:20万颗GPU“烧出”Grok3:业界称“大力出奇迹”仍可行,算力仍是护城河http://www.sushuapos.com/show-2-10863-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: “祥云”AS700D电动型载人飞艇科研首飞成功

下一篇: 外媒:微软称量子计算获突破 利用新物态研发芯片

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜