陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀


  新智元报道  

编辑:庸庸 乔杨
【新智元导读】陶哲轩在最新的采访中,系统地谈到了AI可能会对数学领域产生的影响。他乐观地认为,使用Lean等工具「形式化」数学,在AI的辅助下实现规模化生产——一次证明数百或数千条定理。但他也审慎地预测,数学问题在短期内不会像国际象棋一样被「解决」,但有可能会提高人类科学家的洞察力。

数学历来是一门孤独的科学。

1986 年,安德鲁·怀尔斯(Andrew Wiles)为了证明费马大定理,遁入书斋长达七年之久。

数学家苦心孤诣得到的证明往往让同行难以理解,有些证明至今仍有争议。

但近年来,越来越多的数学领域被严格分解成各个组成部分,我们称之为「形式化」(formalized),这就可以让计算机来检查和验证数学证明。

菲尔兹奖得主、加州大学洛杉矶分校教授陶哲轩坚信,这些方法为数学领域的合作开辟了全新的可能性。

如果再加上人工智能的最新进展,在未来几年里,数学领域可能会出现全新的工作方式。

在计算机的帮助下,一些重大问题可能会被更快解决。

陶哲轩在接受《科学美国人》的德语姊妹刊物Spektrum der Wissenschaft的采访时阐述了他对未来的看法。

以下是采访实录——

「互不信任」的数学家通过AI建立合作

您在旧金山举行的联合数学会议上的一次演讲中,似乎暗示数学家之间互不信任。您这么说是什么意思?

我的意思是,你很难与素未谋面的人合作,除非你能逐行检查他们的作品。通常情况下,五个人是最多的合作人数。

随着自动校验器的出现,这种情况会发生怎样的变化?

现在,你真的可以与数百名素不相识的人合作。你不需要信任他们,因为他们上传代码,Lean编译器就会验证。你可以做比我们通常做的更大规模的数学。

当我用所谓的多项式(PFR)猜想形式化我们最近的成果时,我与20 多人一起工作。我们把证明分成了很多小步骤,每个人都为其中的一个小步骤贡献了证明。

我不需要逐行检查这些贡献是否正确。我只需要对整件事进行管理,确保一切都朝着正确的方向发展。这是一种不同的数学方式,一种更现代的方式。

陶哲轩借助Lean 4成功完成PFR猜想的证明

德国数学家、菲尔兹奖得主Peter Scholze参与了一个Lean项目,尽管他告诉我,他对计算机并不了解。

在这些形式化项目中,并非每个人都需要成为程序员。有些人可以只专注于数学方向,你只是把一个大的数学任务分割成许多小块;有些人则专门负责把这些小部分转化为形式化证明。

我们不需要每个人都成为程序员,我们只需要一些人成为程序员。这是一种分工。

Peter Scholze的液体张量实验采用Lean 3作为项目背后的引擎

Lean将数学「形式化」

20 年前,我听说过机器辅助证明,当时它还是一个非常理论化的领域。每个人都认为,你必须从头开始——将公理形式化,然后做基础几何或代数,而要想进入高等数学,这超出了人们的想象。是什么让形式数学变得实用?

变化之一是标准数学库的开发。尤其是Lean

有一个名为mathlib的庞大项目,所有本科数学的基本定理,如微积分和拓扑学等,都被一一收录到这个库中。

人们已经投入了大量的工作,将公理提升到相当高的水平。我们的梦想是把数学库真正提升到研究生教育的水平。这样,数学的形式化就会容易得多。

我们还期待有更好的搜索方法,因为如果你想证明某件事情,你必须能够找到有关的已经被证实为真的东西。因此,开发真正智能的搜索引擎也是一项重大的新进展。

所以这不是计算能力的问题?

不,一旦我们正式确定了整个PFR项目,编译验证只需要半个小时。这并不是瓶颈,瓶颈在于如何让人类使用它,如何提高可用性和用户友好度。

现在,我们已经有了一个由数千人组成的大型社区,而且还有一个非常活跃的在线论坛来讨论如何让这门语言变得更好。

Lean是目前最先进的系统,还是有其他与之竞争的系统?

Lean可能是最活跃的社区。对于单作者项目来说,也许有其他一些语言略胜一筹,但总体而言,Lean更容易上手。而且它有一个非常不错的库和一个不错的社区。它最终可能会被其他语言取代,但现在它是主流的正式语言。

形式化数学的困境和发展

当你谈论一个不同的数学项目时,有人曾问你是否想把它形式化,你基本上是说这需要太长时间。

我可以将其形式化,但这需要花费我一个月的时间。现在,我认为我们还没有到把所有事情都进行形式化的地步,你必须精挑细选。但技术会越来越好。

因此,我认为在很多情况下,更明智的做法是等到它变得更容易的时候再去做。与其现在花10倍的时间去形式化,不如等待形式化技术的发展,到只需要传统方法一半时间的时候,再去使用。

你甚至说过要把这个系数降到1以下(形式化不比传统方法更费时)。

人工智能确实有可能做到这一点。我认为,在未来,我们不用再把证明打出来,而是直接与某个GPT交互。而GPT会在你进行的过程中,尝试用Lean将其形式化。

如果一切顺利,GPT 会说:「这是你的LaTeX论文,这是你的Lean证明,如果你愿意,我可以按下这个按钮,帮你把它提交给期刊」。未来,它可能会成为一个出色的助手。

到目前为止,证明的想法仍然必须来自人类数学家,不是吗?

是的,形式化的最快方法就是先找到人类的证明。人类提出想法和证明的初稿,然后再把它转换成形式化的证明。

在未来,也许情况会有所不同。可能存在一些我们不知道如何证明整个事情的合作项目,但人们已经有了如何证明小部分内容的想法,他们会把这些想法形式化,并尝试把它们组合在一起。

我可以想象,将来一个大定理会由20个人和一群AI共同证明。随着时间的推移,它们会建立联系,你就能创造出一些奇妙的东西。

这将是伟大的,但要实现这一点,还需要很多年。技术还不成熟,部分原因是形式化现在非常痛苦。

马斯克等人共同创办的xAI公司,他们告诉我,两三年后,数学将像国际象棋一样被「解决」——机器将比人类更擅长寻找证明。

我认为,三年后,AI将对数学家有用,它将成为一个出色的co-pilot(副驾驶员)。

你试图证明一个定理,有一步你认为是正确的,但你不太明白它是如何正确的,你可以说,「人工智能,你能帮我做这个吗?」 它可能会说 「我想我能证明这一点」。

但我不认为数学会被「解决」。如果AI再有重大突破,那是有可能的。

但我想说的是,在三年内,你会看到显著的进步,而且实际使用人工智能会变得越来越容易管理。

举例来说,现在我们一次证明一件事。这就像工匠们在制作木制玩偶之类的东西。你拿起一个玩偶,非常仔细地给所有东西上色,然后再拿起另一个。

我们做数学的方式并没有多大改变。但其他所有学科中都存在批量生产。

有了AI,我们可以一次证明数百或数千条定理,人类数学家将指导AI做各种事情。因此,我认为研究数学的方式将会改变,但他们(xAI)的时间框架可能有点激进。

2018年Peter Scholze获得菲尔兹奖时,我采访了他。我问他,有多少人理解你在做什么?他说大约有10人。

在形式化项目中,我们注意到,你可以与那些不理解整个项目但理解其中一部分的人合作。

这就像任何现代设备一样。没有一个人可以独立制造一台计算机,开采所有的金属并加以提炼,然后制造硬件和软件。我们拥有不同方向的专家,我们有庞大的物流供应链,最终我们可以制造出智能手机或其他产品。

现在,在数学合作中,每个人都必须知道几乎所有的数学知识,正如Scholze提到的,这是一个绊脚石。

但是,有了形式化验证的方法,我们就有可能把一个项目分门别类,只需要知道其中的一部分就能为项目做出贡献。

我认为我们还应该开始将教科书形式化,这样可以有更强的交互性。

你可以假定其中包含很多知识,从非常高层次的意义上描述一个结果的证明。但如果有一些步骤你不理解,你可以扩展它们并深入细节,可以一直深入到公理级别。

然而现在没有人在教科书中这样做,因为太费事了。但如果你已经将其形式化,计算机就可以为你创建这些交互式教科书。

这将使一个领域的数学家更容易开始为另一个领域做出贡献,因为你可以精确地指定一个大任务的子任务,而不需要理解所有的东西。

数学家与AI互动

数学证明不仅仅是为了证明某件事情是正确的,也是为了理解某些东西,对吗?有优美的证明,也有技术性很强但却丑陋的证明。好的证明能让你对问题有更深的理解。那么,如果我们把这个任务交给机器,我们还能理解它们发现的东西吗?

数学家正在做的是,探索什么是真的,什么是假的,以及为什么事情是真的。我们的方法就是通过证明。

每个人都知道,当它是真的时候,我们必须去尝试证明它或反驳它,这需要很多时间,也很乏味。

但在未来,也许我们只需要问AI「这是真的还是假的」?

这样我们就能更有效地探索这个空间,我们就能把精力集中在我们真正关心的事情上。AI将加速这一过程,为我们提供很大帮助。

我们仍然要自己「驾驶」,AI只是co-pilot,至少现在是这样,也许50年后情况会有所不同。但在短期内,人工智能将首先把无聊、琐碎的事情自动化。

人工智能能否帮助我们解决数学中尚未解决的重大问题?

如果你想证明一个尚未解决的猜想,首先要做的一件事就是把它分解成更小的部分,每个部分都有更大的机会被证明。

但你往往会把一个问题分解成更难的问题。将一个问题转化为更难的问题比转化为更简单的问题要容易得多。在这方面,人工智能并没有表现出比人类更好的能力。

在分解问题和探索问题的过程中,你也会学到很多新东西。例如,费马大定理是一个关于自然数的简单猜想,但为证明它而发展的数学却不一定是关于自然数的了。因此,解决证明问题远不止证明这一个实例。

假设人工智能提供了一个难以理解的、丑陋的证明。那么你就可以使用它,分析它。假设这个证明使用了10个假设来得到一个结论,你可以这样思考——如果我删除一个假设,这个证明还有效吗?

这是一门还没有真正存在的科学,因为我们还没有那么多人工智能生成的证明,但我认为将会出现一种新型数学家,他们会利用人工智能生成的数学,使其更易于理解。

就像我们有理论科学和实验科学一样。我们通过经验发现了很多东西,但随后我们做了更多实验,发现了自然规律。

我们现在的数学还做不到这一点。但我认为,未来会有一批人试图从人工智能证明中提取洞察力,而这些证明最初并没有任何洞察力。

因此,与其说这是数学的终结,不如说是数学的光明未来?

我认为会有不同的方法来研究数学,只是这些方法目前还不存在。

我可以看到项目经理式的数学家,他们可以组织非常复杂的项目,他们不能理解全部的数学,但他们可以把事情分成小块,然后委托给其他人,他们有很好的人际交往能力。

此外,还有一些在子领域工作的专家。有些人擅长在特定类型的数学上训练人工智能,有些人则能将人工智能的证明转化为人类可读的东西。

数学领域的运作方式将变得更像几乎任何其他现代行业。比如,在新闻业,并不是每个人都拥有相同的技能,于是有各种职业分工,编辑、记者、商务经理等等。这个领域最终也会出现类似的情况。

我们所研究的数学就是与我们的大脑相匹配的数学,不是吗?如果未来人工智能变得如此聪明,会不会让人类数学家难以理解?

数学已经超越了任何一个人类的思维。数学家通常依赖别人已经证明的结果。他们知道为什么它是真的,他们有一些直觉,但他们不能把它分解成公理。但他们知道去哪里找,或者他们知道谁能找到。

我们已经有很多定理只能通过计算机来验证,一些庞大的计算机计算已经检查了一百万个案例。你可以手工验证,但没人有时间去做,也不值得。

所以,我认为我们会适应的。一个人没有必要检查所有的东西。让电脑来帮我们核对,这对我来说很好。

在数学的最前沿,有很多看似毫不相干的领域的东西被整合在一起,根据我粗浅的理解,一个了解所有这些领域的人工智能可以给你一个提示,然后说:「你为什么不看看那里呢?这也许能帮你解决问题」。

利用人工智能建立联系或至少指出可能的联系,这是一个非常令人兴奋的潜在用途。现在,它的成功率很低。它可能会给你10 建议,其中1个是有趣的,9个是垃圾。实际上,这几乎比随机还糟糕。但这在未来可能会改变。

训练数学人工智能会遇到哪些问题?

部分问题在于它没有足够的数据来进行训练。网上有一些发表的论文,可以用来训练。但我认为,很多灵感并不是在期刊上的论文中捕捉到的,而是在与数学家的对话、讲座以及我们给学生提供建议的过程中捕捉到的。

有时我开玩笑说,我们需要做的是让GPT接受标准的研究生教育,坐在研究生课堂上,像学生一样提问,像人类学习数学一样学习。

公开发表的证明总是浓缩的。即使把人类历史上发表过的所有数学知识都算上,与这些模型所需要的训练数据相比,仍然是小巫见大巫。

人们只发表成功的故事,但真正珍贵的数据来自于尝试。可能起初不太成功,但解决的过程更有价值。然而,大家只公布成功的研究结果,不公布研究的过程。

也许我们应该对证明某事的努力进行登记,就像医学研究一样。研究人员将证明进行登记,即使没有成功,他们也必须将其公布于众。

我们没有这种文化。也许在未来,形式化会变得非常高效,你可以实时地将事情形式化。

如果你想在一个研究项目中使用某个2040年的高级人工智能Lean,并想获得资金来使用这个高级人工智能,你必须同意你的尝试和失败过程都会被记录下来。

然后,这可以用来训练未来的人工智能。或者,其他小组也在研究类似的问题,他们可以看到「哦,其他小组也尝试过同样的事情,但他们失败了」,这样你就不必浪费时间犯一模一样的错误了。

数学家是否在浪费大量时间?

的确如此。如此多的知识不知何故被困在个别数学家的头脑中,只有极少部分被清楚地呈现。我们越是形式化,越多的隐性知识就会显性化,这将带来意想不到的好处。

参考资料:

https://www.scientificamerican.com/article/ai-will-become-mathematicians-co-pilot/


相关推荐

  • 英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
  • 北航等提出超大规模多语言代码评测基准,涵盖40种编程语言
  • ACL 2024 | 多模态大模型能揭示图像背后的深意吗?
  • 惊呆!大模型工程师月薪快10w了!
  • 【第17讲】6月19日,AI智能体实战-第二期
  • 京东员工:年薪百万,到手很“虚”。一年存款只有4万块,日子很“穷”
  • 领域大模型的挑战与机遇:从构建到应用
  • Stanford发布501页全球AI指数报告:中美两国引领世界,但有一项中国不如印度(附报告全文)
  • 突发!Sam Altman与OpenAI股东正式提出公司转型,成为营利性公司!!
  • SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片
  • 有望解决一个千禧年大奖难题,这个20多年前的猜想终于得到证明
  • 英伟达开源最强通用模型Nemotron-4 340B
  • 仅存活三个月的Copilot GPTs,因无盈利希望,被微软强制「退休」
  • 现在起,真正的强者敢于直面「扣子」的「模型广场」
  • Agent云服务,不止做平台|量子位·视点 x 汇智智能
  • AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
  • 奥特曼和老黄动手了……Luma干的
  • 利用大模型进行知识图谱问答的交互式系统LinkQ:兼看中文OCR代表方案、Benchmark及数据合成工具
  • ​DrissionPage,Python浏览器自动化又一神器~
  • 怒删180个服务器!39岁程序员被裁后实施报复,导致公司损失91.8万新币