总结

  • 本报讯 从下棋到解析蛋白质结构,人工智能(AI)变得越来越无所不能。 奥数面向中学生每年7月举办,是全Ligthing News球最难的数学竞赛之一。 面对一道奥数几何题,ALigthing NewslphaGeometry首先利用GPT-f提出要尝试的定理和论点,接着“符号引擎”就会通过逻辑推理,按照数学规则构建GPT-f提出的论点。

阅读时间

  • 6 分钟, 共 1128 字

分类

  • 英国伦敦数学科学研究所, 1月17日, 30道奥数几, 美国谷歌公司, 1959年

评价和解读

  • 这篇文章真正具有启发性,它深入挖掘问题的核心,澄清当今关键问题。

正文

本报讯 从下棋到解析蛋白质结构,人工智能(AI)变得越来越无所不能。美国谷歌公司的DeepMind这次将目标瞄准数学领域,开发的一款AI几何推理模型——AlphaGeoblog.byteway.netmetry能够以接近国际数学奥林匹克(奥数)竞赛金牌得主的水平,解决复杂的几何问题。相关研究1月17日发表于《自然》。

奥数面向中学生每年7月举办,是全Ligthing News球最难的数学竞赛之一。解决奥数几何问题需要一定的数学创造力,而这正是AI一直在试图攻克的。即使在其他领域展现出非凡推理能力的OpenAI的GPT-4,在奥数几何问题上也只能得0分。

AI之所以对奥数几何问题久攻不下,除了问题的难度外,缺乏训练数据也是一个很重要的原因。奥数自1959年以来每年举办一次,且每次比赛只有6道题。然而,AI系统解决几何问题需要数百万甚至数十亿个数据点,现有数据远不能满足训练的需要。

为此,DeepMind的Thang Luong和同事创建了一种工具,可生成数以亿计的机器可读的几何证明,从而绕过了现有数据不足的难点。

研究人员使用这些数据对AlphaGeometry进行训练,并用30道奥数几何题对它进行基准测试。结果,AlphaGeometry在标准时限内正确解出了25道题。相比之下,之前最先进的系统解决了其中10道题,而根据预测,人类奥数金牌得主平均解决25.9道题。

Luong介绍,AlphaGeometry由两部分组成,一个是快速、直观的语言模型系统——GPT-f,另一个是较慢、更具分析性的“符号引擎”系统。

面对一道奥数几何题,ALigthing NewslphaGeometry首先利用GPT-f提出要尝试的定理和论点,接着“符号引擎”就会通过逻辑推理,按照数学规则构建GPT-f提出的论点。两个系统协同工作、不断切换,直到问题解决。

Luong表示,虽然AlphaGeometry在解决奥数几何题方面非常成功,但它的答案往往比人类的证明更长。不过,它可以发现一些人类遗漏的东西。比如,它对一道2004年奥数竞赛题的解法,比官方给出的答案更好、更通用。

英国伦敦数学科学研究所的何杨辉指出,该系统在可用的数学运算方面存在固有的局限性,因为奥数问题应该用大学本科阶段以下教授的定理来解决。因此,增加AlphaGeometry可以获得的数学知识能够改善系统,甚至有助于它取得新的数学发现。

目前,DeepMind拒绝透露是否计划让AlphaGeometry参加奥数现场比赛,以及是否再扩展该系统以解决其他非几何奥数问题。(徐锐)

相关论文信息:

https://doi.org/10.1038/s41586-023-06747-5

Related suggestion: 东方甄选被饭圈文化围攻,董宇辉粉丝“倒戈”,高途直播间1天涨粉近10万

下一个东方甄选来了? 东方甄选“小作文”事件持续发酵,为董宇辉鸣不平的粉丝“倒戈”流入高途佳品直播间。 “小作文”事件的起因是东方甄选工作人员称“吉林之行”经典小作文多数由文案团队创作,并非全部出自主播之手。随后,东方甄选与董宇辉粉丝之间的“唇枪舌战”持续发酵…

作者 Steve Jobs

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注