谷歌AI AlphaEvolve破解数学“外星人难题”:自写算法刷新十年纪录 | AINEWS
type
status
date
slug
summary
tags
category
icon
password
网址

引言:当AI开始“自创”数学工具
在数学界,有一个著名的“外星人难题”——拉姆齐数(Ramsey Numbers)。匈牙利传奇数学家保罗·埃尔德什曾戏言,如果外星人威胁要毁灭地球,除非人类能算出R(5,5)的值,那么人类最理性的选择可能是先发制人或是直接投降,因为其计算量之大超出了人类文明的极限。
然而,就在最近,谷歌DeepMind再次投下震撼弹。他们开发的全新系统 AlphaEvolve,不仅在极值组合学领域取得了重大突破,更是一次性改进了五个经典拉姆齐数的下界。更令人惊叹的是,这些突破并非来自人类设计的特定算法,而是由AI自主编写的“元算法”(Meta-algorithm)完成的。这一成果标志着AI已经从“解题工具”进化为“工具创造者”。想要了解更多前沿AI科技动态,欢迎访问 AINEWS AI门户。
什么是拉姆齐数?为何它是“数学家的噩梦”
拉姆齐理论的核心可以用一个简单的社交例子来理解:在任意六个人中,总能找到三个人互相认识,或者三个人互不认识。用图论的语言表达,R(3,3) = 6。
随着参数的增加,寻找拉姆齐数的难度呈指数级爆炸。寻找“下界”的过程,本质上是构造一个巨大的图,使其不包含特定的子图结构。几十年来,数学家们为了将某个拉姆齐数的下界推进“1”,往往需要手工设计极其精密的搜索算法。而在AlphaEvolve出现之前,许多纪录已经尘封了十年甚至二十年之久。
AlphaEvolve的核心逻辑:进化代码而非仅仅计算
AlphaEvolve与以往AI最大的不同在于,它不直接搜索“图”,而是搜索“生成图的算法”。这是一种被称为元搜索(Meta-search)的机制。其工作流程如下:
- 算法种群初始化:系统维护一个初始的算法池,哪怕最初的代码非常简陋。
- LLM变异驱动:利用大语言模型(如Gemini)对现有的优秀算法代码进行“变异”。AI会尝试修改搜索策略、引入新的启发式规则或调整初始化参数。
- 生存竞争与评分:运行变异后的代码。如果该算法能构造出更大、更符合条件的数学图,它就会获得高分并进入下一轮进化。
- 迭代优化:通过不断的自我迭代,AI最终进化出了一套人类专家难以想象的高效搜索策略。
这种“AI写代码优化算法”的模式,避开了传统人工设计算法的直觉局限,让AI在离散且巨大的组合空间中找到了最优路径。
深度解析:AI自创的四大算法家族
在AlphaEvolve刷新纪录的过程中,它展现出了极高的创造力,生成的算法可以归纳为四大风格迥异的“家族”:
- 代数结构播种流:利用深奥的代数图(如Paley图)作为起点,再进行局部微调。这种方法成功突破了R(4,13)的纪录。
- 循环图与无和集引导:利用代数性质天然规避某些结构,这是刷新纪录最多的方法,助力了R(3,13)和R(3,18)的突破。
- 随机暴力与模拟退火:在较小规模的问题上,AI优化了传统的退火算法,使其效率远超人类手工版本。
- 混合谱方法与分形构造:这是最复杂的一类,AI将分形几何、谱性质分析和动态温度调节融合在一起,构造出了极其精巧的搜索逻辑。
论文作者指出,AlphaEvolve生成的某些策略在现有的数学文献中完全找不到先例。这意味着AI正在通过自主探索,补全人类数学直觉的空白。
飞轮效应:AI自我提升的终极闭环
DeepMind CEO Hassabis对AlphaEvolve寄予厚望。他认为,这不仅仅是数学上的胜利,更是AI自我提升闭环的体现:
- Gemini 生成代码 -> 进化出更优的算法。
- 算法 优化数学难题 -> 同时也优化谷歌的数据中心调度与芯片设计。
- 更强的基础设施 -> 加速下一代更强大AI模型的训练。
这种“知识催生更多知识”的飞轮正在加速旋转。从AlphaGo战胜人类顶尖棋手,到AlphaFold预测蛋白质结构,再到如今AlphaEvolve自主发明算法,AI正从特定领域的专家转变为通用的科学发现引擎。
结论:AI for Science 的新纪元
AlphaEvolve的成功证明了,在面对没有梯度、空间巨大的离散组合问题时,LLM驱动的代码进化具有巨大的潜力。虽然目前AI还主要集中在寻找“下界”(构造反例),但在逻辑证明和寻找“上界”方面,人类与AI的深度协作将是未来的主旋律。
我们正站在一个新时代的起点,AI不再仅仅是人类的助手,它正在重写科学发现的规则。如果您想持续关注AGI、大模型及人工智能的深度解析,请锁定 AINEWS,获取最专业的AI日报与技术指南。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)