设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

价格战凶猛,AI小模型狂飙

发布时间: 来源:

  价格战凶猛,AI小模型狂飙  yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  21世纪经济报道记者孔海丽、实习生刘清怡 北京报道yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  AI小模型大爆发,成为AI巨头的新角力赛场。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  大模型价格战“卷生卷死”,投入了巨额资金的AI企业,亟需在商业故事上再进一步,最近纷纷祭出了自家低成本、易部署的小模型,新一轮较量拉开。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  先是HuggingFace发布了SmolLM - 135M、360M和1.7B,仅使用650B个token进行训练,性能却超过了Qwen 1.5B、Phi 1.5B。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  隔日,Mistral AI和英伟达联合发布Mistral NeMo,被称为“Mistral AI最佳小型模型”,易于使用,可以直接替代任何使用Mistral 7B的系统。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  就在同一天,OpenAI下场“血拼”,推出了GPT-4o 的迷你版――GPT-4o Mini,称这款新模型是“功能最强、性价比最高的小参数模型”,并将其作为展示模型,替换了GPT-3.5的网页版“台前”位置。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  苹果也不甘示弱,与OpenAI同日发布了DCLM小模型,并且发布即开源。苹果ML小组研究科学家Vaishaal Shankar说“这是迄今为止性能最好的真正开源的模型”。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  这些模型参数小、占内存少,在特定场景中,经过精调后使用效果可以媲美大模型,成为性价比之选。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “小模型一定是更容易实现价值的。”IBM中国数据与人工智能首席架构师徐孝天在接受21世纪经济报道记者采访时表示:“一批专业小模型配合agents实现业务流的整合,功能和经济性上都会更加可行。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在AI生成式模型战场上,迭代速度极快,可能今天的“最好”,马上就会被明天的新版本打败,“历史记录”不断被颠覆重写。“模型更新太快,都不好评判,前脚有厂商说自家是‘最大最好的’,后脚就有另外一家说自己是‘最小最好的’。”人工智能行业资深观察人士告诉21世纪经济报道记者,人工智能模型眼花缭乱,AI企业要想跑通商业故事,必须十倍、百倍努力。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  小模型赛道开“卷”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  AI巨头们密集发布小模型,既比性能,还拼价格。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  根据Open AI官网,在MMLU、MGSM、HumanEval、MMMU等基准测试中,GPT-4o mini均展现出了比GPT-3.5 Turbo和Gemini Flash、Claude Haiku等小模型更加出色的文本和视觉推理、数学推理、编码和多模态推理能力,尤其是数学推理和编码能力远胜过GPT-3.5 Turbo和其他小模型,稍弱于GPT-4o。在最新的LMSYS盲测竞技场排名中,GPT-4o mini还取得了与GPT-4o并列第一的好成绩,连OpenAI的CEO Sam Altman也难掩激动的心情,在社交媒体平台上发文称,“我们从未对任何一项评估感到如此兴奋。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  除了优异的性能,OpenAI还拿出了低价杀手锏。7月18日上线时,OpenAI宣布GPT-4o mini的定价为每百万输入token15美分和每百万输出token60美分,比GPT-3.5 Turbo便宜60%以上。7月24日,OpenAI再次宣布,从即日起至9月23日,免费为4级、5级用户提供GPT-4o mini微调服务,每天限制200万token,超过的部分按照每100万token3美元收费。OpenAI称:“我们期待GPT-4o mini将扩大人工智能的应用范围,使人工智能更加实惠。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  平安证券研报认为,GPT-4omini是价格显著下降的新一代入门级别人工智能“小模型”,兼具性能与性价比。当前全球范围内的大模型逐渐呈现由单方面的性能角逐,转向性能与实用性并重的发展趋势。大模型能力达到一定水平时必然会走向应用,大模型厂商通过提升其产品性价比,助推下游应用端的推广部署,有望加速大模型产业链商业闭环的形成。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在GPT-4o mini之后发布的苹果DCLM模型同样引人瞩目,DCLM全面开源了代码、权重、训练流程及数据集。DCLM分为14亿和70亿参数两种规模,其70亿参数版本超越了Mistral-7B ,性能接近Llama 3、Gemma。在MMLU(5-shot)基准测试中,DCLM-7B的准确率为63.7%。根据研究人员的说法,这一性能比此前最先进的开放数据语言模型MAP-Neo提高了6.6%,并减少了40%的计算量。更重要的是,这一结果超越了准确率为62.7%的Mistral-7B-v0.3,并接近于准确率为64.3%的Gemma 8B、66.2%的Llama3 8B和69.9%的Phi-3 7B。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  比起“越大越好”,苹果更倾向于走小模型路线。今年4月,苹果公布的小模型家族四款预训练的大模型OpenELM,体量极小,彼时已在朝着“让人工智能在苹果设备上本地运行”目标迈进。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  6月,苹果曾透露自己的AI发展路线图,计划把小模型顺利嵌进移动装备,不仅能达到“更快速、更安全”的目的,还一举解决了移动端设备与模型融合的终极难题。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Mistral NeMo是Mistral AI与NVIDIA合作构建的,该模型经过先进的微调和对准阶段,在遵循精确指令、推理、处理多轮对话和生成代码方面表现优异。据了解,Mistral NeMo主要面向企业环境,目的是让企业在不需要大量云资源的情况下实施人工智能解决方案。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在接受Venturebeat采访时,英伟达应用深度学习研究副总裁 Bryan Catanzaro 详细阐述了小型模型的优势。他说:“小型模型更容易获取和运行,可以有不同的商业模式,因为人们可以在家中自己的系统上运行它们。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  大模型进入下半场,从技术卷到应用,市场对于更易本地部署的高效率、低成本模型越来越感兴趣,这背后折射了对安全性、隐私性以及高效率、高性价比的渴望。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  行业分析师认为,AI部署有了一个明显的新趋势,即可以在本地硬件上高效运行的模型,正在打消许多企业大规模采用AI方案的担忧,比如数据隐私、延迟以及高成本等问题。“这可能会使竞争更加公平,资源有限的小企业也将获得AI模型的加持,从而弥合与大企业之间先天的差距。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  入局小模型赛道背后yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  AI巨头们为何纷纷开辟小模型赛道?部分或出于成本因素的考量。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  大模型的开发和运行成本高昂,即使像OpenAI这样的巨头也难以负担得起。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  近日,有知情人士分析称“OpenAI今年可能会亏损50亿美元,面临着在12个月内资金耗尽的风险”。截至今年3月,OpenAl花费近40亿美元租用微软的服务器,以运行ChatGPT及其底层大语言模型(LLM)。除了运行ChatGPT之外,OpenAl包括数据费用在内的培训成本今年可能会飙升至30亿美元。据知情人士透露,去年,OpenAl加快了对新AI的训练,速度超过了最初的计划,OpenAl原本计划在这类成本上花费约8亿美元,但最终的支出要多得多。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  相较之下,小模型成本低、响应速度快,而且可以本地化运行,更能适应个性化、精准化的使用需求。业内人士表示:“在全球AI硬件供不应求的前提下,小模型意味着更低的部署和训练成本,其产出效果足以应对一些特定任务。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有国内AI企业相关业务负责人告诉21世纪经济报道记者,小参数规模可以大幅节省推理成本,模型训练与调整所需的硬件成本远远低于大模型,成熟开发者甚至可以低成本训练垂直模型,这些操作的成本都远低于大模型。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI创始成员、特斯拉前AI高级总监Andrej Karpathy最近的预测颇有代表性,他提出,生成式模型的尺寸竞争将会逆转,比拼谁的模型更小、更智能。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在Andrej Karpathy的解释中,当前大模型如此之大,是因为训练期间仍然非常浪费,虽然大模型在记忆方面非常出色,但这也意味着大模型记住了大量无关紧要的细节,而那些内容本不应该在特定问题中反复被调用。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于小模型来说,训练目标变得更简单、直接、高效,让AI更直接地学到更有用的信息。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,大模型与小模型并非“二选一”,他们的发展路线仍然有着相互借鉴的意义。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Andrej Karpathy称:“模型必须先变大,然后才能变小。因为我们需要大模型将数据重构、塑造成理想的形式,一个模型帮助生成下一个模型的训练数据,逐渐得到完美的训练集,再喂给小模型,而后者不需要完全记住所有的知识,只是偶尔需要查找一些东西以确保准确。”yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  李彦宏也曾在百度AI开发者大会Create 2024上表示,未来大型的AI原生应用基本都是Moe架构,即大小模型的混用。李彦宏还称,通过大模型压缩蒸馏出一个基础模型,然后再用数据去训练,比从头开始训练小模型的效果要好很多,比基于开源模型训练出来的模型效果更好,速度更快,成本更低。yLf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  春节档蝶变:从7亿到80亿,从影院冷清到票房飞驰  在刚刚结束的春节档,电影市场再度创造历史。据灯塔研究院最新发布的《龙腾虎跃,势如破竹――2024年春节档电影市场洞察报告》, 2024年春节档(2月10日-2月17日),全国电   春节假期中国民航运输旅客创历史新高  中新社北京2月18日电 (记者 刘文文)记者18日从中国民航局获悉,2024年春节假期(2月10日―2月17日)民航市场平稳有序运行,全国民航累计运输旅客1799.2万人次,日均运输旅客224.9 新华社南昌2月22日电(记者刘佳敏)“江西银河表计有限公司招普工50名,薪资大约4200至4800元。这个公司离立新很近,你有空可以去参观一下。”近日,在九江市永修县立新乡黄婆井村的招聘会现场,村干部和志愿者 龙年开工首周,记者在多地采访看到,企业加快开工复产、劳动者积极返岗求职,呈现出人勤春来早、供需同发力的繁忙景象。“用工忙”折射开局稳,释放出经济运行回稳向好的信心。从跨省招工、专车专列接人返岗   国产手机为什么一机难求  手机市场高质量供给不仅能满足不断升级的消费需求,还能激发消费升级意愿,释放新的发展动能。拥有与时俱进的创新力,培育更多新质生产力,国产手机乃至中国制造才能更有竞争力。  近日,多家   福建今年首个核电机组工程开工  中新社漳州2月22日电 (记者 张金川)福建漳州核电3号机组22日开工建设,这是福建今年首台开工建设的核电机组,标志着漳州核电二期工程建设序幕全面拉开。  据悉,此次开工的二期工程 。

本文链接:价格战凶猛,AI小模型狂飙http://www.sushuapos.com/show-5-23209-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 绿园区妇联举办技能培训 拓宽妇女就业渠道

下一篇: 中药材价格一路“狂飙”:流通环节过热,“药都”出手严查价格哄抬

热门资讯

推荐资讯

  • 2023年出境游相关新增企业同比增长近300%

      近日,据企查查数据显示,国内现存出境游相关企业12.18万家。近十年其注册量呈整体增长态势。2019年注册量达3.34万家,同比增长15.98%,达近十年注册量峰值。此后,受疫情等因素

  • 山东烟台福莱山松鼠乐园将于5月1日正式开业

      近期,烟台福莱山松鼠乐园施工进度已完成95%,将于5月1日正式开业。  据介绍,福莱山松鼠乐园是烟台市首个户外松鼠主题儿童乐园,以“松鼠”为主题建设,项目设置了亲子秋千、

  • 投资14.4亿元,山东江泉文旅城·琅琊梦工厂项目签约

      近日,在2024山东省文旅产业高质量发展大会上,罗韵文化旅游发展集团有限公司与浙江浙旅投资有限责任公司签订江泉文旅城·琅琊梦工厂项目战略合作协议。据悉,该项目计划总投

  • 艺龙酒店科技近200家酒店参与,同程旅行针对广东、湖南推出小站 暴雨守护计划

    近日,广东、湖南等多地因暴雨天气登上热搜。考虑突发强降雨天气给市民及游客带来的不便影响, “同程小站爱心酒店联盟”面向广东、湖南的多个城市推出“暴雨守护计划”,为市民

  • 三特索道2024年一季度实现营收1.42亿元

      4月29日,三特索道发布2024年第一季度财报。财报显示,三特索道2024年一季度实现营业收入1.42亿元,同比下降11.37%;归属于上市公司股东的净利润3379.17万元,同比增长17.67%。

  • 石基信息2023年营收27.49亿元,同比增长5.93%

    4月30日,石基信息发布2023年全年业绩报告。从营收和利润方面看,公司本报告期实现营业总收入27.49亿元,同比增长5.93%,净亏损1.05亿元,亏损同比减少86.57%。从资产方面看,公司报告

  • 中旅旗下设计师品牌,泸沽湖岚岳酒店启幕

    近日,高端设计师品牌酒店——泸沽湖岚岳酒店启幕,该酒店为中旅国际旗下中旅度假在高端酒店市场全新布局的旅游目的地精品度假品牌。泸沽湖岚岳酒店是由知名设计师倾力打造的高

  • 多地酒店不再要求“强制刷脸”

    近日,有媒体报道,在上海市旅馆业治安管理信息系统中相继有通知和提示发布,严禁对已出示本人有效身份证件的旅客进行“强制刷脸”核验,严禁发生不“刷脸”不能入住问题。据央视新

  • 去哪儿:五一假期酒店预订量创平台历史新高

    证券时报网消息,今年五一假期,全国旅游市场多点开花,呈现全面繁荣的态势。据去哪儿数据显示,在去年旅游需求大爆发的基础上,今年五一假期全国热门城市酒店、机票预订量仍有明显增

  • 五一GO!丨“五一”假期首日 全国铁路发送旅客逾2000万人次

    21世纪经济报道记者 高江虹 北京报道“五一”假期首日,国内铁路、民航迎来客流高峰,各大景区进入“人海模式”。中国国家铁路集团有限公司(下

  • 长沙融程铂骊酒店签约,预计今年开业

    近日,位于长沙市中心的融程铂骊酒店成功签约,预计今年正式开业。该酒店作为湖南白金高星级花园式酒店,将提供400余间宽敞舒适的客房,并配备两个大型宴会厅和14个多功能会议室。

  • 许鞍华:仍有想法 还想拍下去

    北京大学教授戴锦华评价导演许鞍华是“香港半部电影史”,“她是我最尊敬的女导演,没有之一。”在有关许鞍华的纪录片《好好拍电影》中,有一个段落是许

  • 日榜
  • 周榜
  • 月榜