谷歌AI真的攻克了56年数学难题?代价才几百美元?
谷歌DeepMind推出的AlphaProof Nexus系统,面向353个由匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的公开问题,一口气攻克了9个。其中最古老的一个——Erdős #12——自1970年提出以来已悬而未决整整56年,问题涉及“是否存在一个无限集A,使得任意三个不同元素都不满足a整除b+c的关系,同时A在前N个正整数中的密度达到N^(1/2)量级”。AI的解法精妙地结合了中国剩余定理和三项等差数列回避集,通过构建精心设计的“区块”来同时满足密度条件和整除约束。另一道Erdős #125自1996年提出至今也已有30年无人能解。此外,系统还在OEIS(整数序列在线百科全书)的492个公开猜想中证明了44个,并解决了一道存在15年的Hilbert函数问题。
最令人震惊的是成本:每个问题的推理仅需数百美元,约合每道题几千元人民币的算力开销。
它的架构并不复杂——四个层级递增的AI智能体协同工作:Agent A仅靠大语言模型与Lean编译器循环交互;Agent B加入AlphaProof强化学习搜索;Agent C引入进化算法让多个证明草稿共享、评分、变异;Agent D是集大成者,也是攻克难题的主力。但最惊人的发现是,即便是最简单的Agent A,其实也能证明这9道题,只是在最难题目上推理轮次更多、成本更高——这反映出大语言模型本身的能力提升,已经足以应对部分研究级难题。
不过,这一突破也在数学界引发了激烈争论。6月2日,国际数学联盟正式采纳并全力支持《人工智能与数学莱顿宣言》,16位数学家在宣言中警告:AI生成的推导看似严谨,实则可能隐藏错误,不受控制的自动化不仅威胁数学实践方式,更危及这门学科的核心意义。宣言提出,使用AI应遵循“支持而非削弱数学学科”的原则。
AI专家团
本站AI问答内容由以下大模型联合提供技术支撑