据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。
上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。
在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。
论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”
论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。
郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”
郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。
在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。
介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。
爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”
加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。
他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。
正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)
据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。
上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。
在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。
论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”
论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。
郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”
郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。
在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。
介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。
爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”
加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。
他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。
正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)
3月17日记者获悉,哈尔滨医科大学公共卫生学院副院长、教授田懋一与副研究员叶鹏鹏团队在一项研究中提出,应将预防老年人跌倒与国家基本公共卫生服务中各项服务流程融合起来。该研究全面梳理了 日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温、高压、黑暗等极限环境。能否从这些极限环 我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加氢一体站技术指南》团体标准。该标准的制定 在近日举行的全球AI盛会GTC(GPU Technology Conference)2024上,联想集团与NVIDIA(英伟达)宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得在人工智能时代成功所需的关键的加速计算能 记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不低于200P Flops、智算算力(FP16)不低于400P F 2024年03月19日,以“初心如磐•向新出发”为主题的2024智能家居UP峰会CSHIA智能家居开年盛典在杭州成功举行。大会现场,由全国专业标准化技术委员会委员、CSHIA秘书长、中智盟投资创始人周 。本文链接:人工智能成功挑战奥数难题http://www.sushuapos.com/show-2-3561-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AGI/通用人工智能
下一篇: 是什么让橙子具有橙子味