华人女学霸AI AxiomProver斩获Putnam满分:AGI时代的数学奇点
type
status
date
slug
summary
tags
category
icon
password
网址

在人工智能发展的历史长河中,数学推理一直被视为攻克AGI(通用人工智能)皇冠上的明珠。近日,一则震撼全球科技界与数学界的消息横空出世:由24岁华人女学霸Carina Hong初创团队打造的AI系统——AxiomProver,在2025年Putnam数学竞赛中拿下了满分成绩。
Putnam竞赛被誉为北美本科生数学竞赛的“天花板”,人类顶尖选手需要在6小时内攻克12道极具挑战性的题目。通常只有极少数的“Putnam Fellows”才能接近满分。而这一次,AI不仅全部答对,还公开了自主生成的Lean证明。这一里程碑式的突破,不仅让陶哲轩等数学泰斗惊叹,更让OpenAI的高层为之侧目。本文将深入解读AxiomProver的这一壮举,分析AI在数学逻辑上的独特思维,以及这一进展对未来大模型发展的深远影响。想要了解更多前沿AI资讯,欢迎访问 AIGC导航。
颠覆认知的满分:AxiomProver的里程碑
AxiomProver在Putnam竞赛中的表现,被网友评价为“比夺得IMO金牌更厉害”。这不仅是因为题目的难度,更是因为AI展示了从自然语言理解到形式化证明的完整闭环能力。
AxiomMathAI官方博客公开了所有的Lean证明(Lean是一种交互式定理证明语言,相当于AI的“数学字典”)。通过分析这些证明,我们可以发现一个有趣的现象:AI与人类对“难度”的感知截然不同。对于人类直觉简单的问题,AI可能需要繁琐的形式化过程;而对于人类感到棘手的组合构造或死算,AI却能展现出惊人的“蛮力美学”。
形式化的代价:人类直觉与机器语言的鸿沟
在本次竞赛中,最能体现人机思维差异的莫过于微积分题目。以A2和B2题为例,这类题目在人类眼中往往极其直觉化。
对于人类数学家来说,看到A2题只需要画一张函数图像,眼睛就能瞬间捕捉到曲线的走势、拐点和趋势,解题思路几乎是显而易见的。然而,在AxiomProver的“眼中”,这些直觉必须被翻译成严格的数学语言。所有的线条变化、正性引理,都需要在Lean代码中逐行定义。
这就导致了一个现象:对人类来说简单的“正性引理”,在Lean里可能要写60多行代码。A2的引理
h_nonpos_on_Icc和B2的引理psi_support_pos成为了证明中最难啃的“钉子户”。这就是“形式化的代价”——将人类显而易见的直觉转化为机器可校验的逻辑,必须缴纳的“税”。组合构造:AI的“耐心”与2000行代码
组合数学题目往往是人类的噩梦,也是AI的传统弱项。但在A5题中,AxiomProver展示了其独特的优势。
面对一道排列组合题,人类和AI都想到了相同的归纳法思路。用人类语言描述,这种论证可能只需两三段文字,配合一些“显然”和“省略号”即可完成。但在Lean的世界里,没有任何模糊空间。每一个特殊情况、每一个繁琐的细节都必须被明确写出。
结果令人咋舌:AxiomProver生成了长达2054行的Lean形式化代码,耗时518分钟。虽然过程繁琐,但这正是机器证明的严谨之处——它拒绝用直觉替代证明文本,而是通过不知疲倦的计算和校验,完成了人类难以忍受的“记账式”推理。
意料之外的突破:无几何引擎的几何解题
最令Axiom团队感到震惊的,是AI在几何(B1)和组合博弈论(A3)上的表现。
一直以来,业界普遍认为几何题需要专门的几何引擎,而组合题是LLM(大语言模型)的软肋。然而,AxiomProver在没有完整几何引擎的情况下,自主解出了B1题。
更有趣的是,AI的解法完全不依赖图像。人类数学家阅读AI生成的证明时,因为没有图而感到晦涩难懂。机器建立了一个“两条圆恰好相交于两个点”的事实,纯粹依靠符号推理,而没有画过一张草图。这表明,AI正在形成一种区别于人类视觉直觉的“符号几何直觉”。
蛮力的胜利与思维的碰撞
在A6题上,AI展示了“蛮力”的胜利。这道涉及p进算术动力系统的题目难倒了众多人类数学家,甚至Axiom团队内部的专家也未能做完。但AxiomProver仅用5小时就完成了证明,它使用了一种人类绝对不会采用的、笨拙但有效的求导方法,硬生生跑通了证明路径。
而在A4题中,我们看到了思维方式的碰撞。人类倾向于用代数方法推导公式,而AI则建议将代数问题转化为几何投影,将人类觉得“应该代数”的东西变成了机械化的组合核算。这种视角的转换,为人类解决数学问题提供了全新的思路。
奇点临近:人机协作的新范式
菲尔兹奖得主陶哲轩认为,AI已经取得了重要里程碑。随着人工智能技术的飞速发展,像AxiomProver这样的系统正在改变数学研究的范式。
未来的工作流或许将是:人类负责提供灵感和高层抽象,机器负责快速自洽检查与形式化落地。正如Axiom团队所比喻的:“机器负责磨豆子,人类负责品咖啡。”我们不需要强行攻克每一个问题,而是通过AI抬高“水面”,让难题自然溶解。
无论是GPT系列的进化,还是AxiomProver的满分,都预示着AGI的奇点正在临近。在这个AI变现和技术爆发的时代,掌握最新的AI新闻和工具至关重要。更多关于大模型API直连及前沿资讯,请持续关注 AIGC导航,获取第一手科技情报。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)