设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

岩芯数智董事长陈代千:通用大模型要解决普适性问题,但必须个性化、低能耗

发布时间: 来源:

21世纪经济报道记者 张赛男 上海报道0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2023年被公认为是“大模型元年”,国内外大模型层出不穷,堪称“百模大战”。在这场竞赛中,通用大模型、垂直大模型、端侧大模型……各家发布的大模型各有特色,都想从中分一杯羹。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2024年开年之际,新的竞争也来临。先是猎豹移动发布猎户星空大模型,后有岩山科技(002195.SZ)旗下岩芯数智推出的自研大模型“Yan模型”……大模型赛道依旧吸引着各路资本的投入。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尽管竞争者众多,但市场总会决出最终的赢家,关键是花落谁家?0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

岩山科技常务副总经理、岩芯数智董事长陈代千对21世纪经济报道记者表示:“最终跑出来的大模型一定具有非常好的用户体验。大模型本质上是用户的体验,不管是B端还是C端,最终是用户来评价这个大模型好用不好用。用户体验怎样才能好?首先,要能完成用户给出的任务,如果不能完成任务,谈高效率、低能耗是不现实的。在能完成任务的基础上,以更低能耗和更高效率去完成,客户才会有很强的意愿去复用。”0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1月24日,岩芯数智发布“Yan模型”,打出的标签是“非Transformer架构”,为国内首个非Attention机制的通用自然语言大模型。在陈代千看来,“Yan模型”去除了Transformer中高成本的注意力机制,代之以计算量更小、难度更低的线性计算,能实现高效率、低能耗的目标。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Transformer架构或许让普通人感到陌生,但其实是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构。凭借着强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,不仅成为自然语言处理领域的主流模型架构,还在计算机视觉、语音识别等多个领域展示了其跨界的通用能力。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在Transformer已经占据人工智能领域半壁江山的今天,岩芯数智为何要另辟蹊径?0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

算力和成本是岩芯数智的出发点。岩芯数智CEO刘凡平介绍,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Yan团队早在三年前就已经开始布局、落地非transformer架构相关的事情。在这个过程中,行业也慢慢了解到transformer架构机制有一些共性的缺陷,所以大家都会去研究有没有其他的算法去优化、甚至替代这个结构。”陈代千说,“我们基于此前的实践,确信非transformer的路线是可行的。”0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

陈代千还谈到,“对很多的企业来说,并不是一定要用千亿大模型,用百亿大模型也许就可以达到效果。在千亿大模型上训练成本太高,以至于可能无法快速迭代。我们对通用大模型的理解是,它当然要解决很多普适性的问题,但是它必须个性化、同时必须低能耗。”他还透露,基于Yan架构,仅需投入同等规模Transformer架构成本的50%甚至更低,就可以拥有百万参数级的大模型。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,这个新架构下的大模型运行效率如何?从岩芯数智给出的对比结果来看,在同等资源条件下,Yan架构的模型,训练效率和推理吞吐量分别是Transformer架构的7倍及5倍,并使记忆能力得到3倍提升。对比数据表明,在单张4090 24G显卡上,当模型输出token的长度超出2600时,Transformer的模型会出现显存不足,而Yan模型的显存使用始终稳定在14G左右,理论上能够实现无限长度的推理。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在主流架构之外去搭建一个新的系统,岩芯数智显然面临着更大的挑战。0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当被问及如何看待全新生态系统带来的难度时,岩芯数智CTO杨华对21世纪经济报道记者坦言,“这个点确实会存在,我们从零开始搭建构建自己的生态,确实需要花费更多时间,但也是我们坚信要走的一条路。”0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他还表示,现在发布的产品是Yan 1.0版本,目前正在做Yan 2.0。“最后的通用人工智能,它肯定不仅仅是现在以语言输入、文本输出等形式,它应该是比如计算机视觉、视频甚至数字信号等全模态的内容都可以输入,然后我的模型也能够以各种形态,比如说以文字吐出、语音合成或者视频、信号处理的方式吐回这个结果。我们想做的Yan 2.0,其实就是往这个方向走,做一个全模态的实时人机交互系统。”0xD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生活方式的改变会影响我们的大脑功能。三个月 记者3月21日获悉,商汤科技与遥感数据平台吉林一号网、四维地球、星图地球等展开合作,此举标志着“SenseEarth智能遥感云”平台数据源全面升级,将为行业用户提供更完善、精准的一体化的高分辨率 3月19日,记者从中国科学院海洋研究所了解到,该所研究团队在国际上首次发布了银鲳的高质量染色体水平参考基因组。相关研究论文近日在线发表于《自然》子刊《科学数据》。银鲳广泛分布于西北太 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 3月25日消息,按照惯例,iPhone会在6月份的WWDC上发布iOS 18、watchOS 11、visionOS 2等全新系统。其中iOS 18比较受关注,被许多爆料者称为iOS史上最大升级。据名记Mark Gurman最新消息, iOS 18将支持 3月22日,中国互联网络信息中心(CNNIC)在京发布第53次《中国互联网络发展状况统计报告》。报告显示,截至2023年12月,我国网民规模达10.92亿人,互联网普及率达77.5%;网络基础设施建设持续加强,新型消费 。

本文链接:岩芯数智董事长陈代千:通用大模型要解决普适性问题,但必须个性化、低能耗http://www.sushuapos.com/show-2-2395-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 新东方发布超预期财报 俞敏洪回应董宇辉流量超过东方甄选

下一篇: 研究表明土壤压实影响大豆根系“进化”

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜