设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了

2024-09-14 09:04:39 来源:

21世纪经济报道记者孔海丽 北京报道JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

预热一年之久,OpenAI代号为“草莓”的项目终于发布。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

北京时间9月13日凌晨,OpenAI甩出了重大更新,传说中推理能力登峰造极的大语言模型——OpenAI o1系列模型亮相,复杂推理能力明显更进一步,极限推理能力甚至超越人类博士水平,代表了大语言模型在推理能力上的重大飞跃。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最惊人的是,OpenAI o1系列已经开始展现出“类思考”的能力——之所以说“类思考”,是因为目前为止,AI大模型尚未突破思考的本质。“自我推理”路径,更像是达到AGI之前的“花活儿”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但,当下还未突破,并不意味着未来不可能。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从“什么都懂一点的‘人工智障’”,到“会自我纠正、选择合适路径”的人工智能,通向AGI的路径,在逐渐清晰。尤其,OpenAI当前放出的o1-preview和o1-mini,还只是o1系列的“前菜”,按照OpenAI的调性,更多突破或许已经发生,只待合适的时机一一发布。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

正如李彦宏戳破大模型“跑分”假象,OpenAI 凭借o1系列,又一次把大模型的竞争拉高到了新的水准,低维度的参数、榜单之争,似乎不再有实际意义。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型开始“逐步思考”

根据OpenAI官方消息,o1系列包括o1-preview和o1-mini,前者是“预览版本”,后者是经济高效的“小模型”,比preview便宜80%。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些模型专门为处理更复杂的、多步骤的问题而开发,尤其是在科学、数学和编程领域,超越了之前的模型(如GPT-4)在推理深度和准确性方面的表现。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman在X上贴出的对比图显示,o1解决数学、编程和博士级别科学题目上的能力,比GPT-4o高出数倍。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI甚至明确指出,“o1不是gpt-4o的继任者”,潜台词在于,o1开启了一段新的纪元。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

整体来看,o1在美国数学奥林匹克预选赛中,排名美国前500名学生之列,并且在物理、生物学、化学基准上,首次超过了人类博士。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但在另一项创新之下,这些得分竟显得“平平无奇”了起来。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1引入了“思路链”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

类似于人类在回答困难问题之前可能会思考很长时间,o1 在尝试解决问题时学会了磨练其思维链并改进策略。它学会了识别和纠正错误,学会了将棘手的步骤分解为更简单的步骤,学会了在当前方法不起作用时继续尝试不同的方法。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方法模拟了人类的认知过程,能够逐步完善每个步骤,甚至在一个问题中实现自我迭代,而结果就是,显著提高了模型的推理能力。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以一道阅读理解题为例,GPT-4o会直接给出结论,而OpenAI o1-preview有“显示思路链”选项,打开之后,o1-preview会将整个思考过程展示出来,逐步分析每个选项,并反复自问“这是一个很好的解释吗?能回答问题本身吗?”并在一遍又一遍地推敲之后,给出正确答案。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,想要节省时间的用户也可以选择“隐藏思路链”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达高级科学家Jim Fan对OpenAI o1高度赞扬,他认为,AlphaGo式的自我学习终于有可能在大模型中实现了。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Strawberry很容易变成一个数据的飞轮。如果答案是正确的,整个搜索跟踪就成为一个小型的训练样本数据集,其中包含正面和负面的反馈。这反过来会改进未来版本GPT的推理核心,就像AlphaGo的价值网络——用来评估每个棋盘位置的质量——随着MCTS生成越来越精细的训练数据而改进一样。”JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,未来大模型自我学习与思考的能力会像一个飞轮一样转起来,就像AlphaGo自己与自己对弈以提升棋艺一样。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一家跨国公司中国区人工智能大模型从业者告诉21世纪经济报道记者,从技术上来说,OpenAI o1“思路链”技术并不是最新的,但这种应用,让人隐约看到了推理层面的Scaling Law。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI官方也盖章,表示随着强化学习(训练时间计算)和思考时间(测试时间计算)的增加,OpenAI o1的性能会不断提高,扩展这种方法的限制与 LLM 预训练的限制有很大不同。他们将持续研究这里面隐含的新的可能性。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离AGI有更近一步吗?

业界对于OpenAI o1所呈现出的“思考”能力,是有分歧的。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一种观点认为,OpenAI o1是人工智能大模型领域总结出Scaling Law之后的最重要进展。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所谓Scaling Law,是指随着参数量、数据量和计算量的增加,大模型的性能能够不断提高。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI o1增加的,是推理过程和思考时间,同样明显提升了模型性能,这打破了大模型进入Scaling Law瓶颈期的担忧。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DCCI互联网数据中心创始人胡延平发表评论称,“草莓”真正开启的角度是让AI开始学会思考,而不只是训练和推理,举一反三,四顾找寻。长思考,慢思考,深度思考。到了草莓这一步,人们对大模型的理解就不能只停留在“对下一个词的猜测、对一个问题的一次性的问答”上了。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但另一种观点认为,前述说法过于夸张。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

两位AI大模型从业者向21世纪经济报道记者表示,OpenAI o1的确在数学和推理能力方面有大幅度提升,但远远不到突破思考本质的阶段。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“OpenAI o1没有解决统计模型根本的缺陷,本质上还是通过大量学习得出正确的结论,很难理解背后的科学逻辑。”前述人士认为,目前,这种“思路链”更像是一种“假性思考”的状态,无需担心大模型已经有了意识。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“而且,人工智能突破思考本质对人类而言,会是非常危险的事情,短时间内还达不到。”他说。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

IDC中国研究总监卢言霞向21世纪经济报道记者表示,“思路链”不算是突破性进展,之前大模型企业都已经在相关技术上有投入,只是大模型持续演进过程的一步。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

卢言霞并不否认大模型的“自学推理”会是scaling law之后另一种有效的能力提升路径,“只是目前的效果和可落地性还需要时间验证”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

连Sam Altman本人,都曾在今年3月份的一次采访中强调,AI目前更多的是一套基于数据和数学的系统,能够产生统计上可能的结果,而不是“生物”这种全新的生命形态。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在OpenAI那场震惊世界的宫斗风波中,有一种说法是,OpenAI前首席科学家Ilya Sutskever是因为看到了一些东西(可能是AGI),这让他内心不安,才说服董事会发起了高层人事“地震”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman也曾反复澄清过:“Ilya看到的不是AGI,没有人见到过AGI,我们还没有建造过AGI。”JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在AGI到来之前,OpenAI亟待解决的现实问题其实是“赚钱”。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期消息显示,OpenAI已就融资事宜与投资者交流,并考虑调整公司架构,以提高对金主的吸引力。与此同时,OpenAI 首席执行官萨姆•奥特曼正在与几家银行洽谈,以循环贷款的方式筹集50亿美元。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在商业变现方面,此前曾传出消息,称“草莓”的订阅价格或飙升至2000美元/月,飙涨100倍。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,OpenAI o1-preview和o1-mini最终发布的价格并没有发生变化,只是限定了使用次数,o1-preview每周限制使用次数为30条消息。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1-mini则是一个较小的模型,在使用与o1相同的高计算强化学习 (RL) pipeline 进行训练后,o1-mini 在许多推理任务上实现了相媲美的性能,同时成本效率显著提高。但o1-mini 在MMLU等任务上的表现则不如GPT-4o,并且由于缺乏广泛的世界认知而在GPQA基准上落后于o1-preview。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不可否认的是,OpenAI每一次都引领了AI大模型的新潮流,且这种野心丝毫不见减弱。最新的发布中,OpenAI表示将在持续迭代的过程中发布OpenAI o1系列的改进版本,o1 及其继任者将为AI在科学、编码、数学和相关领域解锁许多新的用例。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

换而言之,无论o1系列模型是否在历史意义上突破了“思考”本质,OpenAI都在商业层面把其他同类产品一次又一次地甩在了身后,AI大模型的“不进则退”,比其他领域都更悬殊。JaN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了http://www.sushuapos.com/show-2-8460-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年服贸会聚焦新质生产力

下一篇: 苹果AI亮相后,AI端侧的大规模落地还有多远?

热门资讯

推荐资讯

  • 2025 WAIC丨加速规模化应用,与施耐德电气共赢“AI+产业”时代机遇

    7月26日,第八届世界人工智能大会(WAIC 2025)在上海拉开帷幕。作为全球产业技术的领导者,施耐德电气以“智联协同,共炫影响力”为主题在WAIC 2025闪耀登场。 聚焦AI技术在产

  • 66折,李嘉诚家族一项目大降价

    李嘉诚家族旗下企业在惠州开发的一个项目,销售价格进行了幅度不小的下调。 “我们楼盘高层和叠墅的在售房源价格,都有所下调。高层并不是所有户型都有房源在售,像105平方米的

  • 新发国债等利息收入拟恢复征收增值税

    21世纪经济报道记者 唐婧 余纪昕 北京报道8月1日下午,财政部、国家税务总局联合公告,自2025年8月8日起,对在该日期之后(含当日)新发行的国债、

  • 宗氏信托资产界定有争议!宗馥莉:非21亿美元本金,仅其利息

    21世纪经济报道 记者郭聪聪8月1日,牵涉高达21亿美元资产的宗氏家族信托诉讼案在香港开庭。21世纪经济报道记者通过分析香港高等法院披露的

  • 伯克希尔二季度净利润暴跌59%,巴菲特继续“卖卖卖”

    21世纪经济报道记者 吴斌在投资收益的干扰下,伯克希尔-哈撒韦财报数字再度坐上过山车。当地时间8月2日,伯克希尔公布的财报显示,二季度营收为

  • 海通期货大连营业部内控存缺陷被责令改正

      中新经纬8月1日电 据大连证监局网站8月1日消息,大连证监局对海通期货股份有限公司大连营业部采取责令改正监管措施。  来源:大连证监局网站  大连证监局表示,经查,该营

  • 贝因美:坚守5%利润底线,所有品项都没有涨价!

    近日,国家育儿补贴方案正式公布,明确了对符合法规生育的3周岁以下婴幼儿每年补贴3600元,按照工作计划,各地将在8月份陆续开放育儿补贴申领。国家生育补贴政策的落地,提升了社会生

  • 杀疯美国的母婴顶流,要IPO了

    港股IPO太火爆,“神仙妖魔”凑热闹。作者 | 老高来源 | 投资家(ID:touzijias)港股IPO太火爆,“神仙妖魔”凑热闹。投资家网获悉,近日跨境电商行业传来大消息,在美国大杀四方的“出

  • 暑运过半全国铁路发送旅客4.41亿人次

      中新经纬8月1日电 据“中国铁路”微信号8月1日消息,暑运过半全国铁路发送旅客4.41亿人次。  据介绍,铁路暑运自7月1日启动,至7月31日时间过半,全国铁路累计发送旅客4.41亿

  • 工信部:上半年我国软件业务收入同比增11.9%

      中新经纬8月1日电 工信部网站1日公布数据显示,2025年上半年,我国软件和信息技术服务业(以下简称“软件业”)运行态势良好,软件业务收入稳健增长,利润总额保持两位数增长,软

  • 国家发改委:加快推进价格法修订

      中新经纬8月1日电 1日,国家发展改革委就当前经济形势和经济工作举行新闻发布会。会上,国家发展改革委政策研究室主任、新闻发言人蒋毅表示,加快推进价格法修订。修正草案中

  • 国家发改委:推动地方有序减少消费限制

      中新经纬8月1日电 1日,国家发展改革委就当前经济形势和经济工作举行新闻发布会。会上,国家发展改革委国民经济综合司司长周陈表示,落实《提振消费专项行动方案》部署,聚焦文

  • 日榜
  • 周榜
  • 月榜