陶哲轩疯狂安利Copilot：它帮我完成了一页纸证明，甚至能猜出我后面的过程

夕小瑶科技说分享
来源 | 量子位

继给GPT-4“代言”之后，Copilot也被陶哲轩疯狂安利。

他直言，在编程时，Copilot能直接预测出他下一步要做什么。

有了Copilot之后，研究做起来也更方便了，陶哲轩也用它辅助自己完成了最新的研究成果。

陶哲轩说，这次的论文中，有关这一部分的内容其实只有一页。

但具体完成这一页纸的证明，他足足写了200多行代码，用的还是新学的编程语言Lean4。

而在陶哲轩公开代码的GitHub页面上显示，Copilot将写代码的速度提升了一半以上。

陶哲轩介绍，之所以选择Lean4是看中了它的“重写策略”，也就是对一长段表达式进行针对性的局部替换。

举个例子，假如定义了一个复杂的函数f(x)，当我们想输入f(114514)的表达式时，直接用代码把x“重写”成114514就可以了。

陶哲轩说，这个特性相比于需要反复输入公式的LaTeX简直不要太方便。

那么陶哲轩这次的“一页纸证明”又给我们带来了什么新成果呢？

一页纸证明新不等式

这篇论文谈论了有关麦克劳林不等式的问题。

麦克劳林不等式是数学中一个经典的不等式，它基于“非负实数的算数平均值大于等于几何平均值”这一定律导出，可以表述为：

设y1…yn为非负实数，对k=1…n，定义均值Sk为（分母为分子的项数）：

它作为具有根的 n 次多项式的归一化系数而出现。

（记住这个式子，我们称它为式1）

则麦克劳林不等式可以表示为：

其中，当且仅当所有yi相等时等号成立。

在微积分中，还有一个经典的牛顿不等式：

对任意1≤k<n，如果实变量y1…yn均为非负，牛顿不等式就可以简单地描述麦克劳林不等式了：

但如果不加上这个限制条件，即允许负数项的存在，用牛顿不等式就无法表示麦克劳林不等式了。

于是针对牛顿不等式中可能存在负数项的情况，陶哲轩提出了一组新的不等式变体：

对任意r>0且1≤ℓ≤n，必有式2或式3成立。

这便是陶哲轩这一页纸所要证明的内容，具体证明过程是这样的：

不妨构建一个关于复杂变量z的多项式P(z)：

由前面的式1和三角不等式可得：

所以只需要建立下界：

对P(z)取绝对值再取对数可得：

由于对任意实数t，t ↦ log(et+a)呈凸性且a>0，可以得到不等式：

当a=r2，t=2log yj时，可以得出：

以上就是陶哲轩给出的证明过程，但是，当归一化的|Sn|=1时，下式成立：

下一步：建立细化版本

除了这次提到的“一页纸证明”，陶哲轩的这篇论文中还提出了另一项新的定理，即对任意 1 ≤ k ≤ ℓ≤ n.：

在博客文章中，陶哲轩透露，他的下一步计划就是提出这一不等式的细化版本。

陶哲轩说，证明的过程“就像练习一样”会很简单，用微积分就能搞定。

不过，他也提到会有一个小困难，因为这部分论证过程使用到了渐进符号。

新的结论具体怎样，让我们拭目以待。

One More Thing

陶哲轩可谓是AI工具的忠实粉丝，Copilot、GPT-4，还有一些其他辅助工具都受到过他的推荐。

这次，他还对大模型的发展提出了新的期待，希望有一天模型可以直接生成不等式变体。

论文地址：
https://arxiv.org/abs/2310.05328

参考资料

[1]https://mathstodon.xyz/@tao/111271244206606941

相关推荐

“我有一个大胆的想法”？Meta AI 新技术让你的思维图像一览无余！

Stable Diffusion新玩法火了！给几个词就能生成动图，连动图人物的表情和动作都能随意控制

你从来没见过的20种口味可口可乐，看看你爱上了哪一款

SpringBoot 接口签名校验实践

快速掌握 9 种 UML 图，5分钟上手，附10张实操案例！

成都周报 | 苹果CEO库克到访，高新区将设置200亿数字经济基金

动图图解马尔科夫链、PCA、贝叶斯！

倒计时 1 天！1024 程序员节全日程公开（附参会指南）

NVIDIA Jetson助力AI教育教学与视觉感知应用创新

B站数据质量保障体系建设与实践

DeepMind：大模型又曝重大缺陷，无法自我纠正推理，除非提前得知正确答案

H800/A800受限牵涉「云上算力」！美正酝酿新规管制云服务

GPT-4不知道自己错了！ LLM新缺陷曝光，自我纠正成功率仅1%，LeCun马库斯惊呼越改越错

220亿晶体管，IBM机器学习专用处理器NorthPole，能效25倍提升

清华朱文武团队：开源世界首个轻量图自动机器学习库AutoGL-light

UC伯克利团队开源MemGPT大模型上下文内存管理方案；AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源

解决大模型复现难、协作难，这支95后学生团队打造了一个国产AI开源社区

ChatGPT与DALL·E 3之间的行业「黑话」被人发现了

一行代码提高大模型10%性能，开发者：免费午餐

让大模型看图比打字管用！NeurIPS 2023新研究提出多模态查询方法，准确率提升7.8%