GPT一眼看穿30年数学漏洞！陶哲轩：AI科研革命已至

type

status

date

slug

summary

从“抄袭”乌龙到惊天反转：AI揭示数学界30年盲点

故事的核心是著名的“埃尔德什问题”中的第707号。长期以来，数学界普遍认为这是一个悬而未决的难题。然而，普林斯顿大学的Boris Alexeev和俄亥俄州立大学的Dustin G. Mixon在AI的辅助下震惊地发现，这个问题的答案，竟然在一篇30年前的论文中就已经给出了——甚至比问题本身被正式提出的时间还要早！

这堪称数学界的“虚空索敌”，一个存在了三十年的认知盲点被无情揭开。这一反转不仅为当初被嘲讽的OpenAI科学家“正名”，更凸显了一个深刻的问题：在浩如烟海的学术文献中，人类知识的检索、验证和连接是多么困难。

而这，恰恰是大型语言模型的强大之处。当初被视为“抄袭”的文献检索能力，如今看来，其深度和广度已经超越了人类专家的极限，能够发现被遗忘在历史角落里的关键知识。AI不仅仅是搜索，更是在进行一场知识考古。

人机协作新范式：ChatGPT与Lean的形式化证明

发现旧论文只是第一步，更具革命性的是后续的验证过程。为了确保30年前的证明无懈可击，两位数学家决定借助AI，使用形式化证明语言Lean来重新构建和验证整个论证过程。

他们坦言，自己并不熟悉Lean，但ChatGPT强大的代码生成能力，让他们得以通过一种被称为“氛围编程”（vibe coding）的方式与AI协作。这个过程并非一键生成，而是充满了反复的沟通、反馈与修正。人类学者负责提供高层次的逻辑指导和判断，而AI则负责将这些思想精确地翻译成数千行严谨的、可被计算机验证的代码。

最终的成果是惊人的： * 一份超过6000行的Lean代码。 * 包含了26个定义、169个引理和4个核心定理。 * 在普通笔记本电脑上，整个证明的验证过程耗时不到半分钟。

菲尔兹奖得主陶哲轩高度评价了这次合作，他指出这是一个“负责任地使用LLM输出的罕见用例”。关键在于，AI生成的代码并没有被直接当成结论，而是作为一种可被严格验证的工具。这完美地诠释了人机协作的理想模式：人类的智慧与洞察力负责掌舵，AI的强大计算和执行力负责扬帆。

星星之火：AI在科研领域的更多突破

埃尔德什问题的案例并非孤例，AI辅助科研的“星星之火”已在全球范围内呈现燎原之势。

寻找反例：加州大学的数学教授Paata Ivanisvili将ChatGPT列为论文合著者，因为它在一个公开的未解问题中，成功提出了一个可验证的、具体的反例，这种贡献在理论计算机科学中具有开创性。

启发新思路：UCLA的数学教授Ernest Ryu在解决一个凸优化领域的开放性问题时，借助了GPT-4 Pro。尽管模型80%的尝试是错误的，但它提出的新颖思路和论证框架，最终引导教授找到了一个“回想起来非常简单”的证明，将数月甚至数年的探索时间缩短到了12小时。

这些案例共同指向一个未来：AI正在从一个文献检索工具，进化为一个不知疲倦的科研伙伴、灵感催化剂和逻辑验证器。它能快速排除无效路径，生成创新假设，并用代码将抽象的逻辑固化下来，极大地加速了从灵感到成果的转化过程。

如何在国内体验AI科研革命？

看到这里，你是否也对AI在科研和学习中的巨大潜力感到兴奋？无论是进行文献综述、辅助编码、验证逻辑，还是激发全新的创意思路，一个强大且不受限制的AI模型都是不可或缺的。

想要在国内顺畅使用ChatGPT，体验不降智的官方模型，一个稳定可靠的ChatGPT镜像站至关重要。对于追求ChatGPT官方中文版体验的用户，https://chat.aigc.bar 提供了便捷的ChatGPT国内使用方案，无需复杂的设置，让你能直接访问，探索AI在科研、学习和工作中的无限可能。在这里，你可以亲自复现“人机协作”，让AI成为你探索未知领域的强大助力。

结论

从被误解到被正名，GPT在数学领域的这次“大显身手”，标志着一个转折点的到来。我们正在告别单纯依赖人类智慧的传统科研模式，迈入一个人类智慧与人工智能深度融合的新时代。正如陶哲轩所言，这并非AI取代人类的零和游戏，而是一场效率与深度的双重革命。历史铭记的，或许不是一时的争议，而是那一行行由人机协作敲下、并最终悄无声息通过编译的“qed”（证明完毕）。科研的未来，已经到来。