设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了

2024-09-14 09:04:39 来源:

21世纪经济报道记者孔海丽 北京报道9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

预热一年之久,OpenAI代号为“草莓”的项目终于发布。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

北京时间9月13日凌晨,OpenAI甩出了重大更新,传说中推理能力登峰造极的大语言模型——OpenAI o1系列模型亮相,复杂推理能力明显更进一步,极限推理能力甚至超越人类博士水平,代表了大语言模型在推理能力上的重大飞跃。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最惊人的是,OpenAI o1系列已经开始展现出“类思考”的能力——之所以说“类思考”,是因为目前为止,AI大模型尚未突破思考的本质。“自我推理”路径,更像是达到AGI之前的“花活儿”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但,当下还未突破,并不意味着未来不可能。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从“什么都懂一点的‘人工智障’”,到“会自我纠正、选择合适路径”的人工智能,通向AGI的路径,在逐渐清晰。尤其,OpenAI当前放出的o1-preview和o1-mini,还只是o1系列的“前菜”,按照OpenAI的调性,更多突破或许已经发生,只待合适的时机一一发布。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

正如李彦宏戳破大模型“跑分”假象,OpenAI 凭借o1系列,又一次把大模型的竞争拉高到了新的水准,低维度的参数、榜单之争,似乎不再有实际意义。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型开始“逐步思考”

根据OpenAI官方消息,o1系列包括o1-preview和o1-mini,前者是“预览版本”,后者是经济高效的“小模型”,比preview便宜80%。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些模型专门为处理更复杂的、多步骤的问题而开发,尤其是在科学、数学和编程领域,超越了之前的模型(如GPT-4)在推理深度和准确性方面的表现。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman在X上贴出的对比图显示,o1解决数学、编程和博士级别科学题目上的能力,比GPT-4o高出数倍。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI甚至明确指出,“o1不是gpt-4o的继任者”,潜台词在于,o1开启了一段新的纪元。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

整体来看,o1在美国数学奥林匹克预选赛中,排名美国前500名学生之列,并且在物理、生物学、化学基准上,首次超过了人类博士。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但在另一项创新之下,这些得分竟显得“平平无奇”了起来。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1引入了“思路链”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

类似于人类在回答困难问题之前可能会思考很长时间,o1 在尝试解决问题时学会了磨练其思维链并改进策略。它学会了识别和纠正错误,学会了将棘手的步骤分解为更简单的步骤,学会了在当前方法不起作用时继续尝试不同的方法。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方法模拟了人类的认知过程,能够逐步完善每个步骤,甚至在一个问题中实现自我迭代,而结果就是,显著提高了模型的推理能力。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以一道阅读理解题为例,GPT-4o会直接给出结论,而OpenAI o1-preview有“显示思路链”选项,打开之后,o1-preview会将整个思考过程展示出来,逐步分析每个选项,并反复自问“这是一个很好的解释吗?能回答问题本身吗?”并在一遍又一遍地推敲之后,给出正确答案。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,想要节省时间的用户也可以选择“隐藏思路链”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达高级科学家Jim Fan对OpenAI o1高度赞扬,他认为,AlphaGo式的自我学习终于有可能在大模型中实现了。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Strawberry很容易变成一个数据的飞轮。如果答案是正确的,整个搜索跟踪就成为一个小型的训练样本数据集,其中包含正面和负面的反馈。这反过来会改进未来版本GPT的推理核心,就像AlphaGo的价值网络——用来评估每个棋盘位置的质量——随着MCTS生成越来越精细的训练数据而改进一样。”9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,未来大模型自我学习与思考的能力会像一个飞轮一样转起来,就像AlphaGo自己与自己对弈以提升棋艺一样。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一家跨国公司中国区人工智能大模型从业者告诉21世纪经济报道记者,从技术上来说,OpenAI o1“思路链”技术并不是最新的,但这种应用,让人隐约看到了推理层面的Scaling Law。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI官方也盖章,表示随着强化学习(训练时间计算)和思考时间(测试时间计算)的增加,OpenAI o1的性能会不断提高,扩展这种方法的限制与 LLM 预训练的限制有很大不同。他们将持续研究这里面隐含的新的可能性。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离AGI有更近一步吗?

业界对于OpenAI o1所呈现出的“思考”能力,是有分歧的。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一种观点认为,OpenAI o1是人工智能大模型领域总结出Scaling Law之后的最重要进展。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所谓Scaling Law,是指随着参数量、数据量和计算量的增加,大模型的性能能够不断提高。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI o1增加的,是推理过程和思考时间,同样明显提升了模型性能,这打破了大模型进入Scaling Law瓶颈期的担忧。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DCCI互联网数据中心创始人胡延平发表评论称,“草莓”真正开启的角度是让AI开始学会思考,而不只是训练和推理,举一反三,四顾找寻。长思考,慢思考,深度思考。到了草莓这一步,人们对大模型的理解就不能只停留在“对下一个词的猜测、对一个问题的一次性的问答”上了。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但另一种观点认为,前述说法过于夸张。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

两位AI大模型从业者向21世纪经济报道记者表示,OpenAI o1的确在数学和推理能力方面有大幅度提升,但远远不到突破思考本质的阶段。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“OpenAI o1没有解决统计模型根本的缺陷,本质上还是通过大量学习得出正确的结论,很难理解背后的科学逻辑。”前述人士认为,目前,这种“思路链”更像是一种“假性思考”的状态,无需担心大模型已经有了意识。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“而且,人工智能突破思考本质对人类而言,会是非常危险的事情,短时间内还达不到。”他说。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

IDC中国研究总监卢言霞向21世纪经济报道记者表示,“思路链”不算是突破性进展,之前大模型企业都已经在相关技术上有投入,只是大模型持续演进过程的一步。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

卢言霞并不否认大模型的“自学推理”会是scaling law之后另一种有效的能力提升路径,“只是目前的效果和可落地性还需要时间验证”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

连Sam Altman本人,都曾在今年3月份的一次采访中强调,AI目前更多的是一套基于数据和数学的系统,能够产生统计上可能的结果,而不是“生物”这种全新的生命形态。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在OpenAI那场震惊世界的宫斗风波中,有一种说法是,OpenAI前首席科学家Ilya Sutskever是因为看到了一些东西(可能是AGI),这让他内心不安,才说服董事会发起了高层人事“地震”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman也曾反复澄清过:“Ilya看到的不是AGI,没有人见到过AGI,我们还没有建造过AGI。”9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在AGI到来之前,OpenAI亟待解决的现实问题其实是“赚钱”。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期消息显示,OpenAI已就融资事宜与投资者交流,并考虑调整公司架构,以提高对金主的吸引力。与此同时,OpenAI 首席执行官萨姆•奥特曼正在与几家银行洽谈,以循环贷款的方式筹集50亿美元。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在商业变现方面,此前曾传出消息,称“草莓”的订阅价格或飙升至2000美元/月,飙涨100倍。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,OpenAI o1-preview和o1-mini最终发布的价格并没有发生变化,只是限定了使用次数,o1-preview每周限制使用次数为30条消息。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1-mini则是一个较小的模型,在使用与o1相同的高计算强化学习 (RL) pipeline 进行训练后,o1-mini 在许多推理任务上实现了相媲美的性能,同时成本效率显著提高。但o1-mini 在MMLU等任务上的表现则不如GPT-4o,并且由于缺乏广泛的世界认知而在GPQA基准上落后于o1-preview。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不可否认的是,OpenAI每一次都引领了AI大模型的新潮流,且这种野心丝毫不见减弱。最新的发布中,OpenAI表示将在持续迭代的过程中发布OpenAI o1系列的改进版本,o1 及其继任者将为AI在科学、编码、数学和相关领域解锁许多新的用例。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

换而言之,无论o1系列模型是否在历史意义上突破了“思考”本质,OpenAI都在商业层面把其他同类产品一次又一次地甩在了身后,AI大模型的“不进则退”,比其他领域都更悬殊。9Kg速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了http://www.sushuapos.com/show-2-8460-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年服贸会聚焦新质生产力

下一篇: 苹果AI亮相后,AI端侧的大规模落地还有多远?

热门资讯

推荐资讯

  • 两部门:支持优质消费资源与知名IP跨界联名

      中新经纬9月30日电 财政部网站30日消息,财政部、商务部发布关于开展消费新业态新模式新场景试点工作的通知。通知提到,支持具有引领性的国内外品牌开设高能级首店、旗舰店

  • 前8月中国服务进出口总额同比增7.4%

      中新经纬9月30日电 据商务部网站9月30日消息,商务部服贸司负责人介绍2025年1-8月服务贸易发展情况。  2025年1-8月,我国服务贸易稳步增长,服务进出口总额52476.9亿元(人

  • 国资委:着力破解科技创新瓶颈障碍

      中新经纬9月30日电 据国务院国资委网站30日消息,9月28日,国务院国资委召开国有企业改革深化提升行动2025年第三次专题推进会。国务院国资委党委委员、副主任李镇出席会议

  • 宗馥莉,没有娃哈哈

    登上热搜,对于宗馥莉来说早已司空见惯。在过去1年里,外界早已记不清她多少次置身话题中心。日前这一次辞任,对宗馥莉而言意义重大——她辞任娃哈哈集

  • 红塔证券一营业部遭警示:合规管理人员从事客户服务

      中新经纬10月11日电 据重庆证监局网站11日消息,重庆证监局对红塔证券股份有限公司重庆南坪证券营业部出具警示函。  来源:重庆证监局网站  重庆证监局表示,经查,该营业

  • 中冶集团原工会主席屈海燕一审获刑十年半

      中新经纬10月13日电 据“山东高法”公众号消息,2025年10月13日,山东省济宁市中级人民法院一审公开宣判中国冶金科工集团有限公司原工会主席、机关党委书记屈海燕受贿一案

  • 江苏省体育局:2026年“苏超”将继续举办,方案正在研究

      中新经纬10月13日电 据“微讯江苏”微信号13日消息,江苏省体育局解答企业群众反映相关政策热点。其中称,2026年“苏超”将继续举办,赛事方案正在研究中。  有提问称:请问

  • 上纬新材复牌20%跌停 封单超10万手

      中新经纬10月13日电 13日,上纬新材复牌跌停,截至发稿,封单超10万手。来源:Wind  此前,9月26日起停牌的上纬新材披露了核查结果。公司表示,关注到近期市场存在部分媒体关于上

  • 海关总署:初步测算前三季度跨境电商进出口增6.4%

      中新经纬10月13日电 13日,国新办就2025年前三季度进出口情况举行新闻发布会。海关总署新闻发言人、统计分析司司长吕大良在发布会上表示,初步测算,前三季度,我国跨境电商进

  • 亿田智能补税及滞纳金565万元,将计入2025年损益

      中新经纬10月13日电 浙江亿田智能厨电股份有限公司(下称“亿田智能”)13日发布公告称,经自查,公司及全资子公司需补缴税款509.37万元,滞纳金55.74万元,合计565.11万元。  

  • 民营最大运力火箭再出征!引力一号(遥二)发射成功

    北京时间2025年10月11日10时20分,东方空间技术(山东)有限公司最新自主研制的引力一号(遥二)·海澜之家号运载火箭由太原卫星发射中心在海阳附近海域发射升空,将吉林一号宽幅02B07

  • 从信任到托付:平安福理赔30万后,她选择为爱加保

    当30万元平安福重疾理赔款如期到账,平安人寿青岛分公司客户王女士(化名)在倍感安心的同时,做出了一个重要决定:立即为女儿追加投保保额40万元的爱满分保险,总保费12万元。这

  • 日榜
  • 周榜
  • 月榜