米兰 45年数论预想被GPT-5.2 Pro独处完成讲解,陶哲轩:没犯任何过失

发布日期:2026-02-19 16:50    点击次数:84

米兰 45年数论预想被GPT-5.2 Pro独处完成讲解,陶哲轩:没犯任何过失

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

AI讲解数学预想,此次来确切了。

OpenAI最新模子GPT-5.2 Pro刚刚独处讲解了一说念埃尔德什预想。

{jz:field.toptypename/}

论证经过经菲尔兹奖得主陶哲轩考证配置,还被评价为“迄今截止最明确的第一类着力(AI主要孝顺)”。

这说念题是埃尔德什问题库中的第281号,由传闻数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提倡,触及同余遮盖系统与当然密度的深层相干。

45年来,这说念题一直静静躺在问题库里,恭候解答。

直到2026年1月17日,一位名叫Neel Somani的磋磨者把这说念题扔给了GPT-5.2 Pro。

讲解只用到GPT 5.2 Pro

埃尔德什问题网站已收录AI讲解着力。

整个论证在无限阿德尔整数环上张开,借助哈尔测度和点态遍历定理,鸠合紧致性论证完成了从逐点经管到一致经管的跃迁。

按陶哲轩的话说,它是“Furstenberg对应旨趣”的一个变体,这是遍历表面与组合数学交叉界限的尺度用具。

但GPT-5.2 Pro的用法又有些不同,它比时常的论证更依赖伯克霍夫定理。

但是的确让陶哲轩印象潜入的不是讲解要领本人,而是AI莫得犯错。

让我更骇怪的是它幸免了过失,比如极限交换或量词礼貌的转折,这恰是这说念题最容易踩的坑。前几代大说话模子简直笃定会在这些巧妙之处栽跟头。

为了考证这份讲解,陶哲轩躬行脱手,开云官方体育app把整套遍历论论证翻译成了组合学说话,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,再行走了一遍全部推导。

论断:讲解配置。

{jz:field.toptypename/}一个不测的发现

梗直天下盘考GPT-5.2 Pro的讲解时,一位网名KoishiChan的用户在驳斥区抛出了一个令东说念主不测的发现:

这说念题其实有更浅易的解法,何况所需的两个定理早在1936年和1966年就如故存在了。

第一个是达文波特(Harold Davenport)与埃尔德什本东说念主在1936年合营讲解的密度经管定理。

第二个是罗杰斯定理,初度发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典着力拼在一说念,第281号问题简直是告成本质。

这就奇怪了。埃尔德什我方即是1936年那篇论文的合著者,而他在1980年提倡这说念题时,MILAN SPORTS齐莫得贯通到谜底近在目下。

陶哲轩就此事挑升写邮件请示了法国数学家特南鲍姆(Tenenbaum)。

特南鲍姆阐述“只消称心你提到的两个经典着力(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即取得处置”,但他也臆度“问题的表述可能在某个法子被改变过”。不外目前莫得东说念主找到任何其他版块的表述,是以只可按原样处理。

更成心想的是,2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖巨匠在处置另一说念埃尔德什问题时,雷同不知说念罗杰斯定理的存在,直到特南鲍姆辅导他们才补上了援用。

陶哲轩感触:“罗杰斯定理莫得取得它应有的传播。它只出当今哈尔伯斯塔姆-罗斯那本书里,莫得单独发表,文件援用稀稀拉拉。大概这场盘考能让更多磋磨筛法和同余遮盖的东说念主翔实到这个着力。”

最终当今这说念题有了两份讲解:一份来自GPT-5.2 Pro的遍历论旅途,一份来自KoishiChan挖出的经典文件组合。

陶哲轩阐述两者是“不同的讲解”,固然在宗旨上有些重复。

若何评估AI数学的的确成着力

音讯传开后,各路AI模子纷纷被拉来交叉考证。

Gemini 3 Pro暗示讲解莫得问题。另一位磋磨者用GPT-5.2 Pro反复查验论证细节,AI觉得惟一需要补充严格性的所在在第二步,不错用法图引理绕过遍历论告成完成。

不外陶哲轩指出这里法图引理的标的用反:我刚教完磋磨生测度论,这类过失见得太多了。

随后又阐述其实是对补集利用法图引理,标的没问题,论证配置。

但陶哲轩同期发出了精炼的辅导。他写说念:

评估AI用具的确成着力时,最大的统计偏差来自热烈的呈报偏差,负面着力简直不会被透露。

若是某东说念主或某AI公司把用具用在绽放问题上但莫得发达,他们莫得能源呈报这个负面论断;即使呈报了,也不太可能像正面着力那样在酬酢媒体上传播开来。

尽管绝大无数汇集在难度谱系的浅易一端,远不成说明中等难度的埃尔德什问题如故插足AI的射程范围。

他推选了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源样式,系统纪录前沿大说话模子在埃尔德什问题上的正面和负面着力。

数据透露,这些用具在埃尔德什问题上的的确成着力大致只消百分之一到二。

但探究到问题库里有滥觞600说念未解困难,这个比例仍然意味着一批数目可不雅且非平庸的AI孝顺。

参考承接:

[1]https://www.erdosproblems.com/forum/thread/281

[2]https://x.com/neelsomani/status/2012695714187325745

[3]https://mathstodon.xyz/@tao/115911902186528812







Copyright © 1998-2026 米兰体育官方网站 - MILAN™版权所有

sljnzf.com 备案号 备案号: 

技术支持:®米兰体育  RSS地图 HTML地图