12月31日,国内明星大模型创业公司北京智谱华章科技有限公司推出基于扩展强化学习技术训练的推理模型GLM-Zero-Preview,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
GLM-Zero-Preview是GLM-Zero的初代版本。智谱表示,目前的GLM-Zero-Preview与OpenAI的o3模型仍有不少差距,因此未来将持续优化迭代强化学习技术,推出正式版GLM-Zero,将深度思考能力从数理逻辑扩展到更多更通用的技术。
与现有模型不同,GLM-Zero-Preview能够初步实现推理过程中自主决策、问题拆解和尝试多种方式解决问题。团队发现,随着强化学习训练量的增加,模型在深度推理等方面的效果稳步提升。团队也深入探究了模型在推理阶段的scaling law(尺度定律),随着模型可以思考的token数变多以及更多的计算量,模型给出的结果质量稳步提升,体现了“自我反思和优化、复杂问题分解、尝试用不同方法解决问题”等能力,这与人类的思考决策过程类似。
在逻辑推理方面,GLM-Zero-Preview善于识别逻辑漏洞,能够模拟多种假设和可能性。例如在7、9、11、13中如何用3个数字相加得到30,GLM-Zero-Preview能够识别图中数字,通过反思发现答案的关键在于9可以倒置为6(6+11+13=30)。
在数学方面,GLM-Zero-Preview具有更强的归纳与演绎能力,能够快速处理复杂的数学运算,解答包括代数、微积分、概率统计等领域的问题。以2025年考研数学一为例,GLM-Zero-Preview得分为126(总分150),达到优秀研究生水平。GLM-Zero-Preview能够提供详细的解题过程,帮助用户理解问题的核心思路。
GLM-Zero-Preview能够熟练使用多种编程语言,帮助开发者快速编写代码。在代码调试方面能够快速识别错误,给出详细修复建议。例如只需要输入指令“帮我用html写一个有趣的第一人称射击游戏”,GLM-Zero-Preview便能迅速独立完成游戏。
未来,人工智能或将帮助科研工作者跳过文献检索、粗读的过程,直接找到需要的文献,大幅提升科研工作者的文献阅读效率。 随着出版商努力清理大量伪造论文、打击同行评议欺诈行为,2023年,被撤回的研究论文数量已超过1万篇,打破了年度纪录。 12月19日,“复旦大学·绍兴周”系列活动在复旦大学开启,这也是“复旦大学·城市周”的首期活动。 本次 12月13至14日,在教育部、陕西省人民政府的支持下,由教育部学校规划建设发展中心主办,陕西省教育厅、西安建筑科技大学、绿 据哈尔滨工业大学机电工程学院消息,中国共产党党员,哈尔滨工业大学液压传动与控制专业的创始人、机电学院教授刘庆和同 浙江省科学技术厅浙江省自然科学基金委员会关于下达2024年度浙江省基础公益研究计划自筹经费项目的通知 各有关单位: 为 。本文链接:智谱发布推理模型初代版本http://www.sushuapos.com/show-11-15836-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 两度打破校史!他为全球治理提供创新方案