设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

2024-03-26 17:05:38 来源: 量子位

ChatGPT反应亮了qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

鱼羊 克雷西 发自 凹非寺qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIqU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克说到做到:qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

旗下大模型Grok现已开源qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型——qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就是说,这是当前开源模型中参数量最大的一个。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

消息一出,Grok-1的GitHub仓库已揽获4.5k标星,并且还在库库猛涨。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

表情包们,第一时间被吃瓜群众们热传了起来。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而ChatGPT本Chat,也现身Grok评论区,开始了和马斯克新一天的斗嘴……qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

那么,话不多说,来看看马斯克这波为怼OpenAI,究竟拿出了什么真东西。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Grok-1说开源就开源

此次开源,xAI发布了Grok-1的基本模型权重和网络架构。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体来说是2023年10月预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结构上,Grok-1采用了混合专家(MoE)架构,包含8个专家,总参数量为314B(3140亿),处理Token时,其中的两个专家会被激活,激活参数量为86B。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

单看这激活的参数量,就已经超过了密集模型Llama 2的70B,对于MoE架构来说,这样的参数量称之为庞然大物也毫不为过。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

不过,在GitHub页面中,官方也提示,由于模型规模较大(314B参数),需要有足够GPU和内存的机器才能运行Grok。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这里MoE层的实现效率并不高,选择这种实现方式是为了避免验证模型的正确性时需要自定义内核。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

模型的权重文件则是以磁力链接的形式提供,文件大小接近300GB。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而且这个“足够的GPU”,要求不是一般的高——YC上有网友推测,如果是8bit量化的话,可能需要8块H100。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

除了参数量前所未有,在工程架构上,Grok也是另辟蹊径——qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

没有采用常见的Python、PyTorch或Tensorflow,而是选用了Rust编程语言以及深度学习框架新秀JAX。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在官方通告之外,还有许多大佬通过扒代码等方式揭露了Grok的更多技术细节。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如来自斯坦福大学的Andrew Kean Gao,就针对Grok的技术细节进行了详细解释。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,Grok采用了使用旋转的embedding方式,而不是固定位置embedding,旋转位置的embedding大小为 6144,与输入embedding相同。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

当然,还有更多的参数信息:qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 窗口长度为8192tokens,精度为bf16
  • Tokenizer vocab大小为131072(2^17),与GPT-4接近;
  • embedding大小为6144(48×128);
  • Transformer层数为64,每层都有一个解码器层,包含多头注意力块和密集块;
  • key value大小为128;
  • 多头注意力块中,有48 个头用于查询,8 个用于KV,KV 大小为 128;
  • 密集块(密集前馈块)扩展因子为8,隐藏层大小为32768。
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

除了Gao,还有英伟达AI科学家Ethan He(何宜晖)指出,在专家系统的处理方面,Grok也与另一知名开源MoE模型Mixtral不同——qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Grok对全部的8个专家都应用了softmax函数,然后从中选择top2专家,而Mixtral则是先选定专家再应用softmax函数。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而至于有没有更多细节,可能要看官方会不会发布进一步的消息了。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另外,值得一提的是,Grok-1采用的是Apache 2.0 license,也就是说,商用友好qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为怼OpenAI怒而Open

大家伙知道,马斯克因为OpenAI不Open,已经向旧金山高等法院提起诉讼,正式把OpenAI给告了。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过当时马斯克自己搞的Grok也并没有开源,还只面向的付费用户开放,难免被质疑双标。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大概是为了堵上这个bug,马斯克在上周宣布:qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本周,xAI将开源Grok。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

虽然时间点上似乎又是马斯克一贯的迟到风格,但xAI的这波Open如今看来确实不是口嗨,还是给了网友们一些小小的震撼。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

有xAI新晋员工感慨说:qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这将是激动人心的一年,快系好安全带吧。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

有人已经期待起Grok作为一个开源模型,进一步搅动大模型竞争的这一池水。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,也并不是每个人都买马斯克的账:qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

不过说归说,多线并进的马斯克,最近大事不止开源Grok这一件。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作为多公司、多业务的时间管理大师,马斯克旗下,特斯拉刚刚全线推出了端到端纯视觉的自动驾驶系统FSD V12,所有北美车主用户,都OTA更新升级,可以实现所有道路场景的任意点到点AI驾驶。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SpaceX则完成了第三次星舰发射,虽然最后功败垂成,但又史无前例地迈进了一大步。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

推特则开源了推荐算法,然后迎来了一波自然流量新高峰。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

别人都是 you can you up, no can no bb…马斯克不一样,bb up不选择,边喊边干,还都干成了。qU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

参考链接:
[1]https://github.com/xai-org/grok-1
[2]https://x.ai/blog/grok-osqU8速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:马斯克突然开源Grok:3140亿参数巨无霸,免费可商用http://www.sushuapos.com/show-2-4204-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能

下一篇: 大模型落地“诸神之战”,场景玩家先杀出重围了

热门资讯

  • 站在“人工智能+”探索前列

    今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是

  • 我国科研团队揭示非洲猪瘟病毒感染致病机制

    记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制

  • 迄今最大三维宇宙地图发布

    国际天文学家团队绘制了迄今最大的三维宇宙地图,记录了大约130万个活跃类星体在空间和时间上的位置。它将成为探测类星体、暗物质晕和超大质量黑洞

  • 研究发现神经系统疾病成人类健康主要“杀手”

    据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成

  • 甘肃首座特高压换流站迎来“新成员”

    3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”—&mdas

  • 省电“神器”是“黑科技”还是智商税?

    3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这

  • 太空培育类器官或带来疾病新疗法

    自2019年以来,科学家已经在国际空间站上培育出了包括人类大脑、心脏和乳房在内的多个类器官模型。这些类器官通常利用人类干细胞培育而成,在一系列化

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • 1799元!红米狙击一加Ace3V 简直就是来捣乱的

    一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回

  • huaweiP70系列发布在即!供应链已开始批量供货:出货目标相当乐观

    3月24日消息,据媒体报道,huawei电话供应链公司,已开始向huaweiP70系列高端旗舰电话批量供货。同时有产业链人士透露,huawei给出的P70系列出货目标指引相对

  • 第三颗“厦门造”卫星出征

    3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

推荐资讯

  • 日榜
  • 周榜
  • 月榜