GPT一眼看穿30年数学漏洞!陶哲轩:AI科研革命已至
type
status
date
slug
summary
tags
category
icon
password
网址

一场科学界的风波,从最初的“抄袭”乌龙,到如今的惊天反转,主角都是同一个——以GPT为代表的先进人工智能。菲尔兹奖得主陶哲轩更是断言:AI驱动的科研革命已经开始。这不仅仅是一个关于数学难题的故事,更是一扇通往全新科研范式的窗户,预示着人类与AI协作探索未知的新纪元。
事件的起因颇具戏剧性。OpenAI科学家曾因宣称GPT解决了多个悬赏的“埃尔德什问题”而遭到群嘲,因为AI做的似乎只是“检索”到了已有的文献答案。然而,最近的一项发现,却让所有人重新审视AI在学术研究中不可估量的价值。
从“抄袭”乌龙到惊天反转:AI揭示数学界30年盲点
故事的核心是著名的“埃尔德什问题”中的第707号。长期以来,数学界普遍认为这是一个悬而未决的难题。然而,普林斯顿大学的Boris Alexeev和俄亥俄州立大学的Dustin G. Mixon在AI的辅助下震惊地发现,这个问题的答案,竟然在一篇30年前的论文中就已经给出了——甚至比问题本身被正式提出的时间还要早!
这堪称数学界的“虚空索敌”,一个存在了三十年的认知盲点被无情揭开。这一反转不仅为当初被嘲讽的OpenAI科学家“正名”,更凸显了一个深刻的问题:在浩如烟海的学术文献中,人类知识的检索、验证和连接是多么困难。
而这,恰恰是大型语言模型的强大之处。当初被视为“抄袭”的文献检索能力,如今看来,其深度和广度已经超越了人类专家的极限,能够发现被遗忘在历史角落里的关键知识。AI不仅仅是搜索,更是在进行一场知识考古。
人机协作新范式:ChatGPT与Lean的形式化证明
发现旧论文只是第一步,更具革命性的是后续的验证过程。为了确保30年前的证明无懈可击,两位数学家决定借助AI,使用形式化证明语言Lean来重新构建和验证整个论证过程。
他们坦言,自己并不熟悉Lean,但ChatGPT强大的代码生成能力,让他们得以通过一种被称为“氛围编程”(vibe coding)的方式与AI协作。这个过程并非一键生成,而是充满了反复的沟通、反馈与修正。人类学者负责提供高层次的逻辑指导和判断,而AI则负责将这些思想精确地翻译成数千行严谨的、可被计算机验证的代码。
最终的成果是惊人的:
* 一份超过6000行的Lean代码。
* 包含了26个定义、169个引理和4个核心定理。
* 在普通笔记本电脑上,整个证明的验证过程耗时不到半分钟。
菲尔兹奖得主陶哲轩高度评价了这次合作,他指出这是一个“负责任地使用LLM输出的罕见用例”。关键在于,AI生成的代码并没有被直接当成结论,而是作为一种可被严格验证的工具。这完美地诠释了人机协作的理想模式:人类的智慧与洞察力负责掌舵,AI的强大计算和执行力负责扬帆。
星星之火:AI在科研领域的更多突破
埃尔德什问题的案例并非孤例,AI辅助科研的“星星之火”已在全球范围内呈现燎原之势。
- 寻找反例:加州大学的数学教授Paata Ivanisvili将ChatGPT列为论文合著者,因为它在一个公开的未解问题中,成功提出了一个可验证的、具体的反例,这种贡献在理论计算机科学中具有开创性。
- 启发新思路:UCLA的数学教授Ernest Ryu在解决一个凸优化领域的开放性问题时,借助了GPT-4 Pro。尽管模型80%的尝试是错误的,但它提出的新颖思路和论证框架,最终引导教授找到了一个“回想起来非常简单”的证明,将数月甚至数年的探索时间缩短到了12小时。
这些案例共同指向一个未来:AI正在从一个文献检索工具,进化为一个不知疲倦的科研伙伴、灵感催化剂和逻辑验证器。它能快速排除无效路径,生成创新假设,并用代码将抽象的逻辑固化下来,极大地加速了从灵感到成果的转化过程。
如何在国内体验AI科研革命?
看到这里,你是否也对AI在科研和学习中的巨大潜力感到兴奋?无论是进行文献综述、辅助编码、验证逻辑,还是激发全新的创意思路,一个强大且不受限制的AI模型都是不可或缺的。
想要在国内顺畅使用ChatGPT,体验不降智的官方模型,一个稳定可靠的ChatGPT镜像站至关重要。对于追求ChatGPT官方中文版体验的用户,
https://chat.aigc.bar 提供了便捷的ChatGPT国内使用方案,无需复杂的设置,让你能直接访问,探索AI在科研、学习和工作中的无限可能。在这里,你可以亲自复现“人机协作”,让AI成为你探索未知领域的强大助力。结论
从被误解到被正名,GPT在数学领域的这次“大显身手”,标志着一个转折点的到来。我们正在告别单纯依赖人类智慧的传统科研模式,迈入一个人类智慧与人工智能深度融合的新时代。正如陶哲轩所言,这并非AI取代人类的零和游戏,而是一场效率与深度的双重革命。历史铭记的,或许不是一时的争议,而是那一行行由人机协作敲下、并最终悄无声息通过编译的“qed”(证明完毕)。科研的未来,已经到来。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)