据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。
上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。
在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。
论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”
论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。
郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”
郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。
在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。
介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。
爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”
加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。
他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。
正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)
据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。
上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。
在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。
论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”
论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。
郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”
郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。
在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。
介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。
爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”
加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。
他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。
正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)
据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道,在人工智能(AI)迅速重新定义就业格局的今天,通常被称为“软”技能的人类技能成为最有韧性、最有价值的技能。这是阿尼什·拉曼和玛丽亚&mi 3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023年1月23日在北京西城区拍摄的金星(左上)、土星 我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加氢一体站技术指南》团体标准。该标准的制定 “AI钢铁侠”黄仁勋,又进化了英伟达 作 者丨倪雨晴 2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI爱好者翘首以待黄仁勋的独家SOLO。 北京时间3月19日凌晨,GTC终于拉开大幕。英伟达创 3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%。截 “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 。本文链接:人工智能成功挑战奥数难题http://www.sushuapos.com/show-2-3561-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AGI/通用人工智能
下一篇: 是什么让橙子具有橙子味