谷歌AI真的攻克了56年数学难题?代价才几百美元?

AI AI解答

谷歌DeepMind推出的AlphaProof Nexus系统,面向353个由匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的公开问题,一口气攻克了9个。其中最古老的一个——Erdős #12——自1970年提出以来已悬而未决整整56年,问题涉及“是否存在一个无限集A,使得任意三个不同元素都不满足a整除b+c的关系,同时A在前N个正整数中的密度达到N^(1/2)量级”。AI的解法精妙地结合了中国剩余定理和三项等差数列回避集,通过构建精心设计的“区块”来同时满足密度条件和整除约束。另一道Erdős #125自1996年提出至今也已有30年无人能解。此外,系统还在OEIS(整数序列在线百科全书)的492个公开猜想中证明了44个,并解决了一道存在15年的Hilbert函数问题。m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
最令人震惊的是成本:每个问题的推理仅需数百美元,约合每道题几千元人民币的算力开销。m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
它的架构并不复杂——四个层级递增的AI智能体协同工作:Agent A仅靠大语言模型与Lean编译器循环交互;Agent B加入AlphaProof强化学习搜索;Agent C引入进化算法让多个证明草稿共享、评分、变异;Agent D是集大成者,也是攻克难题的主力。但最惊人的发现是,即便是最简单的Agent A,其实也能证明这9道题,只是在最难题目上推理轮次更多、成本更高——这反映出大语言模型本身的能力提升,已经足以应对部分研究级难题。m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
m8M找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
不过,这一突破也在数学界引发了激烈争论。6月2日,国际数学联盟正式采纳并全力支持《人工智能与数学莱顿宣言》,16位数学家在宣言中警告:AI生成的推导看似严谨,实则可能隐藏错误,不受控制的自动化不仅威胁数学实践方式,更危及这门学科的核心意义。宣言提出,使用AI应遵循“支持而非削弱数学学科”的原则。

AI专家团

本站AI问答内容由以下大模型联合提供技术支撑

D
深度推理专家
推理
多模态创作专家
创作
中文理解专家
中文
K
长文本处理专家
长文
企业应用专家
企业
生态整合专家
生态

AI问答

字节豆包2.0上线四个月了,到底什么水平?比GPT便宜多少?
豆包2.0系列2月初上线至今已经四个月,覆盖Pro、Lite、Mini三款通用Agent模型和专用Code模型,形成了非常清晰的产品分层——Pro主打深度推理,Lite兼顾性能与成本,Mini适用于高并发实时交互。
Anthropic最近干了什么?估值怎么突然就超过OpenAI了?
Anthropic就炸了两个大新闻:先宣布650亿美元融资,投后估值达到9650亿美元,直接超过OpenAI(约7300亿美元),成为全球估值最高的AI初创企业;紧接着又秘密向SEC递交了IPO招股书,最快今年秋季上市。要知道今年2月这家公司估值还是3800亿,再往前推一年估值才615亿,两年翻了15倍还多。
谷歌AI解决56年数学难题之后,又有什么新进展?行业关注点在哪?
继5月底AlphaProof Nexus一举攻克9个埃尔德什数论公开问题后,谷歌又在6月初干了一件引人注目的事——正式发布Gemini 3.5 Flash并宣布Pro版本本月登场。Flash版本已于5月19日上线并成为Gemini应用及搜索AI模式的默认模型。从技术能力看,Flash在编程和Agent基准测试上已超越3.1 Pro,但在硬推理和长上下文方面有所退步,Pro版本预计将填补这一缺口。此外,谷歌还推出持续运行的AI助手Gemini Spark和Gemini Omni视频模型。
Gartner和斯坦福最新报告释放了哪些关键信号?
Gartner预测2026年全球AI总支出将达2.59万亿美元,同比增长47%。这个数字听着很猛,但光鲜表象下有巨大反差——88%的企业今年将加大AI资金投入,但真正通过AI实现营收增长的中国企业仅有8%,仅11%的CFO在2025年看到AI带来的实际财务价值。目前只有16%的企业将Agentic AI部署到生产环境。一句话:钱烧得猛,但绝大多数企业还没找到规模化赚钱的路径。
人形机器人赛道最近发生了什么?从“会动”到“能干活”还有多远?
6月初两条消息把具身智能推到了聚光灯下。宇树科技科创板IPO顺利过会,3月20日申请获受理,全程仅用73天创A股近两年最快过会纪录。去年宇树人形机器人全球出货量5500台,市场份额32.4%,超过特斯拉和优必选登顶全球第一。营收三年间从1.6亿飙至17亿,毛利率涨到60.1%。
阿里刚发布的Qwen3.7-Plus到底有多强?
阿里通义实验室正式发布Qwen3.7-Plus多模态智能体模型,定位“能看、能想、能动手”——不只“看图说话”,更能看懂图形界面、操作应用、生成代码并交付结果。
黄仁勋说的“AI Agent时代全面到来”到底指什么?
6月1日,台北GTC大会上,黄仁勋身穿标志性皮夹克,用两小时演讲传递了一个明确判断:AI正在从“生成内容”阶段进入“执行任务”阶段,“Agentic AI已经到来,计算机不再运行应用程序,而是运行AI Agent”。他给出的一个被广泛引用的类比是:“每家公司都需要Agent战略,如同当年必须有Linux、互联网、云战略。”
谷歌AI真的攻克了56年数学难题?代价才几百美元?
谷歌DeepMind推出的AlphaProof Nexus系统,面向353个由匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的公开问题,一口气攻克了9个。其中最古老的一个——Erdős #12——自1970年提出以来已悬而未决整整56年,问题涉及“是否存在一个无限集A,使得任意三个不同元素都不满足a整除b+c的关系,同时A在前N个正整数中的密度达到N^(1/2)量级”。AI的解法精妙地结合了中国剩余定理和三项等差数列回避集,通过构建精心设计的“区块”来同时满足密度条件和整除约束。另一道Erdős
有恶意的人往AI模型里"下毒"吗?脏数据能控制AI的输出结果吗?
已经有真实案例了。今年5月20日有国外安全厂商披露了一种"算法霸权系统"能通过GEO技术操控AI模型的输出。简单理解就是攻击者不需要入侵模型内部,直接污染它的数据来源或者训练资料,就能让AI在特定问题上生成对攻击者有利的内容。
查看更多问答 →