设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

发布时间: 2024-03-26 17:05:38 来源: 量子位

ChatGPT反应亮了dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

鱼羊 克雷西 发自 凹非寺dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIdSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克说到做到:dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

旗下大模型Grok现已开源dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型——dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就是说,这是当前开源模型中参数量最大的一个。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

消息一出,Grok-1的GitHub仓库已揽获4.5k标星,并且还在库库猛涨。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

表情包们,第一时间被吃瓜群众们热传了起来。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而ChatGPT本Chat,也现身Grok评论区,开始了和马斯克新一天的斗嘴……dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

那么,话不多说,来看看马斯克这波为怼OpenAI,究竟拿出了什么真东西。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Grok-1说开源就开源

此次开源,xAI发布了Grok-1的基本模型权重和网络架构。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体来说是2023年10月预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结构上,Grok-1采用了混合专家(MoE)架构,包含8个专家,总参数量为314B(3140亿),处理Token时,其中的两个专家会被激活,激活参数量为86B。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

单看这激活的参数量,就已经超过了密集模型Llama 2的70B,对于MoE架构来说,这样的参数量称之为庞然大物也毫不为过。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

不过,在GitHub页面中,官方也提示,由于模型规模较大(314B参数),需要有足够GPU和内存的机器才能运行Grok。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这里MoE层的实现效率并不高,选择这种实现方式是为了避免验证模型的正确性时需要自定义内核。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

模型的权重文件则是以磁力链接的形式提供,文件大小接近300GB。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而且这个“足够的GPU”,要求不是一般的高——YC上有网友推测,如果是8bit量化的话,可能需要8块H100。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

除了参数量前所未有,在工程架构上,Grok也是另辟蹊径——dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

没有采用常见的Python、PyTorch或Tensorflow,而是选用了Rust编程语言以及深度学习框架新秀JAX。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在官方通告之外,还有许多大佬通过扒代码等方式揭露了Grok的更多技术细节。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如来自斯坦福大学的Andrew Kean Gao,就针对Grok的技术细节进行了详细解释。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,Grok采用了使用旋转的embedding方式,而不是固定位置embedding,旋转位置的embedding大小为 6144,与输入embedding相同。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

当然,还有更多的参数信息:dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 窗口长度为8192tokens,精度为bf16
  • Tokenizer vocab大小为131072(2^17),与GPT-4接近;
  • embedding大小为6144(48×128);
  • Transformer层数为64,每层都有一个解码器层,包含多头注意力块和密集块;
  • key value大小为128;
  • 多头注意力块中,有48 个头用于查询,8 个用于KV,KV 大小为 128;
  • 密集块(密集前馈块)扩展因子为8,隐藏层大小为32768。
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

除了Gao,还有英伟达AI科学家Ethan He(何宜晖)指出,在专家系统的处理方面,Grok也与另一知名开源MoE模型Mixtral不同——dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Grok对全部的8个专家都应用了softmax函数,然后从中选择top2专家,而Mixtral则是先选定专家再应用softmax函数。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

而至于有没有更多细节,可能要看官方会不会发布进一步的消息了。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另外,值得一提的是,Grok-1采用的是Apache 2.0 license,也就是说,商用友好dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为怼OpenAI怒而Open

大家伙知道,马斯克因为OpenAI不Open,已经向旧金山高等法院提起诉讼,正式把OpenAI给告了。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过当时马斯克自己搞的Grok也并没有开源,还只面向的付费用户开放,难免被质疑双标。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大概是为了堵上这个bug,马斯克在上周宣布:dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本周,xAI将开源Grok。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

虽然时间点上似乎又是马斯克一贯的迟到风格,但xAI的这波Open如今看来确实不是口嗨,还是给了网友们一些小小的震撼。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

有xAI新晋员工感慨说:dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这将是激动人心的一年,快系好安全带吧。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

有人已经期待起Grok作为一个开源模型,进一步搅动大模型竞争的这一池水。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,也并不是每个人都买马斯克的账:dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

不过说归说,多线并进的马斯克,最近大事不止开源Grok这一件。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作为多公司、多业务的时间管理大师,马斯克旗下,特斯拉刚刚全线推出了端到端纯视觉的自动驾驶系统FSD V12,所有北美车主用户,都OTA更新升级,可以实现所有道路场景的任意点到点AI驾驶。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SpaceX则完成了第三次星舰发射,虽然最后功败垂成,但又史无前例地迈进了一大步。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

推特则开源了推荐算法,然后迎来了一波自然流量新高峰。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

别人都是 you can you up, no can no bb…马斯克不一样,bb up不选择,边喊边干,还都干成了。dSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

参考链接:
[1]https://github.com/xai-org/grok-1
[2]https://x.ai/blog/grok-osdSP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣耀CEO赵明表示,人工智能大模型时代,他们的AI战 据英国《自然》杂志网站19日报道,美国华盛顿大学科学家首次使用生成式人工智能(AI)工具,帮助他们制造全新抗体。研究团队表示,AI设计抗体或能更好靶向一些很难被攻击的药物标靶,但这些抗体距离临床 3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/小时速度运行的列车,每公里实际运行平均能耗 在日常生活中,隧道可以帮助人们翻山越岭。在植物细胞内,当内部物质穿过细胞膜时,往往也会通过类似的“隧道”。记者从中国科学技术大学获悉,该校孙林峰团队在第六大植物激素——油菜素 据英国《自然》周刊网站3月19日报道,研究人员首次利用生成式人工智能(AI)制造出全新抗体。报道称,本周生物学预印本资料库中的一份预印本报告的原理验证研究,提高了将“AI指导的蛋白质设计引入治 记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理谱系特征,在多维尺度上为研究蚊虫病毒组提供 。

本文链接:马斯克突然开源Grok:3140亿参数巨无霸,免费可商用http://www.sushuapos.com/show-2-4204-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能

下一篇: 大模型落地“诸神之战”,场景玩家先杀出重围了

热门资讯

  • 淋巴结冻干“锁鲜”技术或可用于肿瘤治疗

    人体免疫系统中的小过滤器淋巴结有了新妙用。近日,浙江大学药学院、金华研究院教授顾臻团队联合多位科研人员,在国际上首次提出利用冷冻干燥的淋巴结

  • Sora将如何影响科学与社会

    英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内

  • 人工智能探究癌症发展机理

    据英国《金融时报》网站3月13日报道,科学家们已经在利用人工智能(AI)阐释人体所谓的“黑暗基因组”,并开发一种可能很强大的癌症检测、监测和治疗新

  • 海龟深潜时一分钟心跳只有两次

    据《日本经济新闻》3月19日报道,东京大学副教授坂本健太郎等人研究发现,海龟下潜时心率将急剧下降。海龟与鲸等哺乳类动物同样,心率随下潜深度加深而

  • 我国科学家揭示东北黑土成因

    记者3月20日从中国科学院地质与地球物理研究所获悉,该所科研人员在东北黑土区开展了大范围的野外调查和样品采集工作,通过分析采集的黑土样品发现,黑

  • 走进新中国建材科技的发源地,探索“隐秘”的玻璃世界

    玻璃,是我们日常生活中常见且应用非常广泛的一种材料,如外墙、窗户、杯子、灯饰……但玻璃的应用远不止于此。2024年3月22日14时,由中国

  • 与狗互动有助放松和提高注意力

    据韩国建国大学研究人员发表在最新一期开放获取期刊《公共科学图书馆·综合》上的一项研究,与狗共度美好时光可减轻压力,同时可增强与放松和注

  • 黑场显微镜让单个颗粒实现无标记光学显微成像

    3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤

  • 世界睡眠日:别让你的良好睡眠被手机夺走

    再打一局游戏就睡,再刷几个视频就睡,终于放下手机,关灯睡觉了……结果翻来覆去睡不着,半夜醒来再也睡不着,为什么明明睡着了,睡眠质量却不高

  • 量子互联网:小荷已露尖尖角

    近日,美国纽约州立大学石溪分校科学家菲格罗阿等人在一篇发表于《自然·量子信息》上的论文中称,他们通过把两个独立的光子存储在铷气里,首次在

  • 不用贴膜了!huaweiMate 70系列搭载“玄武镀膜”:防划、防反光

    3月25日消息,去年huawei在Mate 60系列上首发了玄武机身架构,采用一体化金属机身,搭配上超耐用锦纤材质,使整机的抗挤压能力提高10倍,使用更放心。“玄武”是

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

推荐资讯

  • 日榜
  • 周榜
  • 月榜