设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

2024-04-02 06:43:37 来源: 量子位

基于Llama架构WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

澜舟科技官宣:孟子3-13B大模型正式开源!WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尤其在参数量20B以内的轻量化大模型领域,在中英文语言能力方面尤为突出,数学和编程能力也位于前列。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

据介绍,孟子3-13B大模型是基于Llama架构,数据集规模高达3T TokensWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

语料精选自网页、百科、社交、媒体、新闻,以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练,模型的中文能力突出并且兼顾多语言能力。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

孟子3-13B大模型开源

只需两步,就能使用孟子3-13B大模型了。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先进行环境配置。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

pip install -r requirements.txtWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后快速开始。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer =WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
AutoTokenizer.from_pretrained(“Langboat/Mengzi3-13B-Base”, use_fast=False, trust_remote_code=True)
model =WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
AutoModelForCausalLM.from_pretrained(“Langboat/Mengzi3-13B-Base”, device_map=”auto”, trust_remote_code=True)
inputs = tokenizer(‘指令:回答以下问题。输入:介绍一下孟子。输出:’, return_tensors=’pt’)
if torch.cuda.is_available():
inputs = inputs.to(‘cuda’)
pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(pred[0], skip_special_tokens=True))WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,他们还提供了一个样例代码,可用于基础模型进行单轮交互推理。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

cd examples
python examples/base_streaming_gen.py –model model_path –tokenizer tokenizer_pathWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果想要进行模型微调,他们也提供了相关文件和代码。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

事实上,早在3月18日的澜舟大模型技术和产品发布会现场,就透露了孟子3-13B大模型的诸多细节。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当时他们表示,孟子3-13B大模型训练已经完成。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于选择13B版本的原因,周明解释道:WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,澜舟明确以服务ToB场景为主,ToC为辅。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实践发现,ToB场景使用频率最高的大模型参数量多为7B、13B、40B、100B,整体集中在10B-100B之间。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,在这个区间范围内,从ROI(投资回报率)角度来讲,既满足场景需求,又最具性价比。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,在很长一段时间内,澜舟的目标都是在10B-100B参数规模范围内,打造优质的行业大模型。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作为国内最早一批大模型创业团队,去年3月,澜舟就发布了孟子GPT V1(MChat)。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

好了,感兴趣的朋友可戳下方链接体验一下。WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GitHub链接:WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://github.com/Langboat/Mengzi3WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
HuggingFace:WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://huggingface.co/Langboat/Mengzi3-13B-BaseWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
ModelScope:WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://www.modelscope.cn/models/langboat/Mengzi3-13B-BaseWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Wisemodel:WoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://wisemodel.cn/models/Langboat/Mengzi3-13B-BaseWoB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练http://www.sushuapos.com/show-2-4453-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 百度携手优必选,共探AI大模型+人形机器人创新应用

下一篇: 机器狗首次阵亡!美国警方披露详情

热门资讯

推荐资讯

  • 申万宏源西部证券一营业部被警示

      中新经纬10月16日电 因合规管控不到位,申万宏源西部证券有限公司五家渠振兴街营业部(下称“五家渠振兴街营业部”)及前任负责人魏泽被警示。  近日,新疆证监局发布的《

  • 中国移动为“客户回国后手机被保护性关停”致歉

      中新经纬10月16日电 “中国移动新疆公司”公众号16日发布《关于客户回国后手机“被保护性关停”的情况说明》称,公司存在跨省协同不畅、主动服务意识不足等问题,对此深表

  • 吉美达、冀雅电子等5公司未按规定披露年报遭警示

      中新经纬10月16日电 因未按规定披露2024年年度报告,5家公司被河北证监局出具警示函。  来源:河北证监局网站  具体来看,据河北证监局网站10月14日披露的行政监管措施决

  • 迈入“巨作时代”,小游戏彻底杀疯了

    小而不凡,成为小游戏的真实写照。以小游戏为抓手的世纪华通,上演了一年涨6倍的好戏,不但成为资本市场的超级明星,也一跃成为头部游戏厂商。与之对应的

  • 10月17日央行开展1648亿元7天期逆回购操作

      10月17日央行开展1648亿元7天期逆回购操作  中新网10月17日电 据央行网站消息,2025年10月17日中国人民银行以固定利率、数量招标方式开展了1648亿元7天期逆回购操作。

  • 上期所调整金银期货涨跌停板幅度为14%

      中新经纬10月17日电 17日晚间,上海期货交易所发布《关于调整黄金和白银期货交易保证金比例和涨跌停板幅度的通知》称,经研究决定,自2025年10月21日(星期二)收盘结算时起,黄

  • 寒武纪前三季度营收增超23倍

      中新经纬10月17日电 中科寒武纪科技股份有限公司(下称“寒武纪”)17日披露2025年第三季度报告。  第三季度,寒武纪实现营收17.27亿元,同比增长1332.52%;归属于上市公司股

  • 多家银行宣布:清理长期不动户!余额10元还能取吗?

      中新经纬10月17日电 (魏薇)你还记得自己有多少银行账户吗?这些账户多久没用过?账户里有多少余额?  近期,多家银行发布公告称,将加强对长期不动户的管理,还有银行调整长期不

  • 首席看机遇丨3亿多人撑起的养老新蓝海,投资机遇在哪?

      中新经纬10月17日电 题:3亿多人撑起的养老新蓝海,投资机遇在哪?  作者 胡玉玮 中信建投证券政策研究首席分析师  我国人口结构变迁持续演进,养老发展转型势在必行。“十

  • 比亚迪召回共115783辆唐、元Pro汽车

      中新经纬10月17日电 据国家市场监督管理总局网站消息,日前,比亚迪汽车工业有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求,向国

  • 互联网十大伦敦金app实时交易排行榜(2025版)

    "新手适合哪款?"" 高频交易看什么指标?""资金存管安全吗?"—— 在黄金投资社群里,这些问题每天都被反复追问。不同投资者的需求从来都是千人千面:上班族需要稳定流畅的轻量化 APP

  • 新手怎么炒黄金?先选对平台!国内五大新手友好黄金交易平台排名

    随着全球经济波动加剧,黄金作为传统避险资产备受投资者青睐。然而对于投资新手来说,炒黄金第一步不是分析行情,而是选择一个安全、低成本且操作简单的交易平台。 据中国黄金协

  • 日榜
  • 周榜
  • 月榜