智谱发布推理模型初代版本

发布时间: 2025-01-02 09:51:54 来源：澎湃新闻

观看：127

12月31日，国内明星大模型创业公司北京智谱华章科技有限公司推出基于扩展强化学习技术训练的推理模型GLM-Zero-Preview，擅长处理数理逻辑、代码和需要深度推理的复杂问题。

GLM-Zero-Preview是GLM-Zero的初代版本。智谱表示，目前的GLM-Zero-Preview与OpenAI的o3模型仍有不少差距，因此未来将持续优化迭代强化学习技术，推出正式版GLM-Zero，将深度思考能力从数理逻辑扩展到更多更通用的技术。

与现有模型不同，GLM-Zero-Preview能够初步实现推理过程中自主决策、问题拆解和尝试多种方式解决问题。团队发现，随着强化学习训练量的增加，模型在深度推理等方面的效果稳步提升。团队也深入探究了模型在推理阶段的scaling law（尺度定律），随着模型可以思考的token数变多以及更多的计算量，模型给出的结果质量稳步提升，体现了“自我反思和优化、复杂问题分解、尝试用不同方法解决问题”等能力，这与人类的思考决策过程类似。

在逻辑推理方面，GLM-Zero-Preview善于识别逻辑漏洞，能够模拟多种假设和可能性。例如在7、9、11、13中如何用3个数字相加得到30，GLM-Zero-Preview能够识别图中数字，通过反思发现答案的关键在于9可以倒置为6（6+11+13=30）。

在数学方面，GLM-Zero-Preview具有更强的归纳与演绎能力，能够快速处理复杂的数学运算，解答包括代数、微积分、概率统计等领域的问题。以2025年考研数学一为例，GLM-Zero-Preview得分为126（总分150），达到优秀研究生水平。GLM-Zero-Preview能够提供详细的解题过程，帮助用户理解问题的核心思路。

GLM-Zero-Preview能够熟练使用多种编程语言，帮助开发者快速编写代码。在代码调试方面能够快速识别错误，给出详细修复建议。例如只需要输入指令“帮我用html写一个有趣的第一人称射击游戏”，GLM-Zero-Preview便能迅速独立完成游戏。

“太忙了。”这是清华大学人工智能（AI）国际治理研究院副院长梁正面对记者脱口而出的一句话。去年11 ·“Apollo开放平台9.0拥有极强场景通用能力，适配环节减少40% 、代码阅读量减少90%、代码调试量减少80%，可以实现‘ 近日，“面向经济主战场共建科技创新生态”科技创新驱动高质量发展研讨会在京举行。中国科学院相关科研院所数十位专家出近日，罗氏制药第三届支付创新大会在上海举办。本次活动以“同星共创，聚氏未来”为主题，汇聚了来自医药企业、商业保险近日，日本政府批准了一项立法，要求6所顶尖大学成立新的管理政策委员会，使外部专家在决策中有更大的发言权。据《科 2日，世界华人数学家联盟2023年会在复旦大学开幕。这是世界华人数学家联盟年会首次在上海举行。当天，上海数学与交叉学。

本文链接：智谱发布推理模型初代版本http://www.sushuapos.com/show-11-15836-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：两度打破校史！他为全球治理提供创新方案

下一篇：中国博士后科学基金会与安徽省联合资助获资助人员名单

智谱发布推理模型初代版本

热门资讯

推荐资讯

科学最热文章