v2.41.4746 安卓最新版
v2.361.3351.496147 IOS版
v8.699 安卓版
v1.683 IOS版
v9.105 安卓最新版
v4.998 最新版
v6.268.2581 安卓版
v6.930.8889.55687 安卓最新版
v8.719.9317.217217 安卓免费版
v6.586.5616 IOS版
v7.204 安卓免费版
v4.232 安卓汉化版
v2.870.2339.698570 最新版
v9.632.2548 最新版
v4.65.3652.850964 安卓最新版
v9.330.6644.160386 最新版
v4.129.796 最新版
v7.919 安卓最新版
v3.956.3078 PC版
v2.369.7010 安卓版
v9.793.6152 PC版
v1.251.2340.260611 安卓最新版
v4.50 PC版
v2.717.6627.516191 安卓最新版
v1.493.6017 安卓汉化版
v8.411 IOS版
v3.757.8180.892934 最新版
v5.683.1600 安卓最新版
v5.688.1646 安卓版
v5.567.6529.248376 安卓最新版
v1.942.5932.343390 IOS版
v6.84.4609 安卓版
v6.817.3773 PC版
v3.333.3364.946635 安卓免费版
v1.904.3231.724968 最新版
v7.825 PC版
v8.309.9830.265530 最新版
v2.800.5785.541469 安卓版
v9.35 安卓最新版
v1.699.8349 安卓最新版
v2.305.676 PC版
v3.215 IOS版
v3.483.7677 安卓最新版
v4.225.4122.854667 IOS版
v1.928 IOS版
v7.332 最新版
v7.607 安卓最新版
v2.976.5757.166588 安卓免费版
v8.885 安卓免费版
v5.957 安卓免费版
v3.951.7682 安卓汉化版
v8.644 最新版
v5.510.1985.788858 最新版
v7.455.4868.860485 PC版
v7.248.2909.614345 最新版
v3.682.6423 安卓汉化版
v3.36.9872.685616 安卓免费版
v5.246.3802 安卓免费版
v8.618 安卓免费版
v1.778.7270 IOS版
v8.602 安卓最新版
v6.219.9619.342510 安卓免费版
v2.223.8101.819930 IOS版
v1.92.9534 安卓版
v6.901.7359 安卓免费版
v9.961.7033.822174 IOS版
v4.81.5581.218609 安卓最新版
v7.629 安卓最新版
v8.560 PC版
v1.659.9190 IOS版
v2.42.807.897823 安卓免费版
v6.471.4544.35321 安卓汉化版
v9.261 安卓免费版
v2.272.201 安卓汉化版
v3.70.4724 安卓汉化版
v7.642 最新版
v1.504.9917 IOS版
v4.202 安卓版
v8.365.4846.563758 安卓最新版
v6.420.7808 安卓版
水果派app网页版
机器之心报道
机器之心编辑部
刚刚,Erdos 问题 #124 的一个弱化版本被证明。
这个问题自 1984 年在《算术杂志》上发表的论文 「整数幂集的完备序列」 中提出以来,近 30 年一直悬而未决
证明该问题的是普林斯顿大学数学博士 Boris Alexeev ,使用了来自 Harmonic 的数学 AI 智能体 Aristotle运行了这个问题,智能体最近更新了更强的推理能力和自然语言界面。
关于该问题的一些报道都声称AI独立解决了该问题的完整版本,事实却并非如此,产生了很多争议。Boris Alexeev 为此进行了修正:
在 Formal Conjectures 项目中,该猜想有一个正式声明。不幸的是,该声明中有一个拼写错误,其中注释在显示式方程中显示为 「≥1」 ,而相应的 Lean 声明为 「= 1」。(这使得声明变弱了。)因此,我也修正了这个问题,并包含了对修正后声明的证明。最后,我删除了我认为是不必要的声明方面,Aristotle 也证明了这一点。正如 DesmondWeisenberg 所提到的,存在一个涉及幂次 1(这里对应个位数)的问题,这意味着 [BEGL96] 中的猜想与此不同。我相信 [Er97] 中的版本与这里的陈述相符,部分原因在于它缺少 [BEGL96] 中明显必要的最大公约数条件。我目前无法获取 [Er97e] 来检查其中的陈述。考虑到Aristotle 的成就,这个问题如此微妙,实在不幸!
尽管如此,数学智能体独立地证明了 Erdos 问题#124的较简单版本,仍然表现了令人惊讶的数学证明能力。
Erdos 问题 #124 内容如下图所示,由于该证明存在微妙的错误,目前仍是一个开放问题。
Erdos 问题 #124 链接:https://www.erdosproblems.com/forum/thread/124
数学 AI 智能体 Aristotle 是一个一个用于自动形式化和形式验证的 API。根据 Harmonic 的介绍,其具备利用 IMO 金牌级引擎解决最复杂的推理问题的能力;可以自动将英语陈述和证明转换为经过验证的 Lean4 证明;能够无缝集成到项目中,自动利用用户的整个定理库和定义、依赖项以及 Mathlib。
Aristotle 链接:https://aristotle.harmonic.fun/
在 Erdos 问题 #124 的讨论中,tsaf 简要介绍了 Aristotle 针对该问题的证明方法,称其「出奇的简单」
有关详细的证明过程,感兴趣的读者可以参考:
https://github.com/plby/lean-proofs/blob/main/ErdosProblems/Erdos124.md
对于 AI 独立进行完整的数学难题的证明,陶哲轩进行了深度的关注。在该问题下,也能看到他的评论。
陶哲轩对于 AI 工具在数学领域的观点仍然一以贯之,他认为像许多其他真实世界中的分布一样,数学中的未解决问题也呈现出典型的「长尾」结构
在数学的未解决问题中有很多没有得到关注的相对容易的问题,借助人工智能的强大自动化能力和推理能力去规模化地尝试攻克这些问题,就会有许多「低垂的果实」唾手可得。
陶哲轩在去年运行 Equational Theories Project 时亲眼见证了这一点。
这个项目攻击了普遍代数中 2200 万个蕴含式。利用简单的自动化方法的最初几轮扫描,在几天内就解决了其中相当大的一部分;随后又使用越来越复杂的方法,逐步攻克那些在早期扫描中顽固抵抗的剩余实例。最后的少数几个蕴含式则花费了数月的人类努力才最终解决。
陶哲轩在这个项目中取得了大规模自动化数学研究的宝贵经验,他以个人日志的形式完整记录了研究的详细过程,方法,结果和个人的思考。
日志链接:https://github.com/teorth/equational_theories/wiki/Terence-Tao's-personal-log
Erdos 问题网站也是类似的例子。该网站目前收录了 1108 个在至少一篇埃尔德什论文中提出过的问题;其中当然包含一些极其困难的经典难题,但也有大量更偏门的问题,甚至连 Erdos 本人都没怎么关注过。
与 Equational Theories 的经验类似,陶哲轩现在也开始采用自动化方法,集中清理掉最底层的「低垂果实」。
几周前,网站上一批仍被标注为未解决的问题突然被划为「已解决」:AI 驱动的文献搜索工具发现,它们的解答其实早已存在于文献中。正在研究这些问题的数学家们也结合使用 AI 工具和形式化证明助手,来用 Lean 验证已有证明、生成这些问题关联的整数序列项,或补全某些方案中缺失的推理步骤。
陶哲轩认为,Erdos 问题#124的证明属于另一类「低垂果实」,是由于描述中的技术性疏漏,而变得意外容易解决的问题。
具体来说,Erdos 问题 #124 在三篇论文中被提出过,但其中两篇漏掉了一个关键假设,导致问题在那两种表述下直接成为一个已知结果(Brown 判别法)的推论。然而,这一点直到 Boris Alexeev 使用 Aristotle 工具处理该问题时才被发现。Aristotle 在数小时内就自主找到并(用 Lean)形式化了该弱化版本的解答。
目前,研究者正系统性地扫描网站上的剩余问题,以寻找更多类似的误述或快速的解决方法。这些努力短期内仍主要集中在「长尾」的最末端。
然而,这已经显示出自动化工具能力的不断增强,并在另一层面上帮助了研究这些问题的人类数学家:通过清除最容易的部分,使真正困难的问题更加清晰地呈现出来。
或许,从 AI 能够独立解决数学问题开始,我们就已站在数学领域深刻变革的边缘。
数学领域 Vibe 证明的时代已经悄然而至。
相关版本
多平台下载
查看所有0条评论>网友评论