陶哲轩上手Copilot:不可思议,它能从定理名字猜出我想要的方向

机器之心报道

编辑: 蛋酱、小舟


尝鲜 GPT-4 之后,陶哲轩又用上了 Github Copilot。


这一次,他的试用场景是学习 Lean 语言并利用其形式化数学定理。



对于大模型来说,形式化的定理证明也算一种挑战。形式化证明本质上是一种计算机程序,但与 C++ 或 Python 中的传统程序不同,证明的正确性可以用证明助手(比如 Lean 语言)来验证。定理证明是代码生成的一种特殊形式,在评估上非常严格,没有让模型产生幻觉的空间。


而陶哲轩提到的定理,来自 10 月 9 日的一篇论文:



论文中的这个证明只有不到一页,但陶哲轩的形式化证明使用了 200 行 Lean 语言。


举例来说,在论文中,陶哲轩只是断言对于任意 a>0 的情况,在实数上是凸的,因为这是一个常规的微积分练习,然后调用了 Jensen 不等式,但写出所有细节用了大约 50 行代码。


陶哲轩表示,Github copilot 能够正确预测各种例行验证的多行代码,并从定理的名字等线索中推断出他想要的方向,这种能力是「不可思议」的。


Lean 的「重写」策略是不可或缺的,它可以通过有针对性的替换来修改冗长的假设或目标,无需完整地键入表达式就能对其进行操作。


「在用 LaTeX 撰写证明时,我经常粗略地模拟这种方法,将我要处理的冗长表达式从一行剪切粘贴到下一行,然后进行有针对性的编辑,但这有时会导致错字在文档中多行传播,因此能以自动和可验证的方式进行重写是件好事。」


论文中还提到一个不等式,即对于任意的 k, l, n,满足 



陶哲轩表示下一个目标就是建立该不等式的简单版本,即论文中的不等式 (1.8):



这部分的证明主要还是利用微积分的知识,但有一个难点是需要使用渐近符号。陶哲轩表示后续的论证虽然会很耗时,但并不是特别困难。



但目前的工具仍有一些局限性,例如,重写涉及绑定变量(如数列中的求和变量)的表达式并不总是很容易完成。他期待着有一天,人们可以简单地要求自然语言 LLM 进行此类转换……
参考链接:https://mathstodon.xyz/@tao/111271244206606941




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

相关推荐

  • 你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测
  • 口型几乎完美、还能卡点,霉霉说地道中文的视频火了,背后AI工具原来是它
  • 首个软件专利获得者离世,享年93岁,他为软件争得知识产权法保护
  • 仅5个字符的新绘图语言火了,ChatGPT都学会了
  • 几秒生成高清商拍大片,电商效率直接Pro Max | 虹软科技推出PhotoStudio* AI
  • 4年百亿估值,国产大模型创业TOP 1,清华造
  • 讲真,普通人的真实出路
  • BeanPostProcessor 是在何时介入 Bean 创建的?
  • 欧洲的高福利,靠什么撑起来的?
  • 永辉超市,北京研发团队被一锅端?
  • 36个顶级数据分析方法与模型!
  • 多数据源管理:掌握 @DS 注解的威力
  • 用 AI 写了10万行代码后,我总结了这些好用的经验
  • 没事别碰 GPT-4-32K,太太太太太贵了!
  • 【编制单位招聘前端,后端,软件工程等相关人员】 正式编!六险二金!提供住宿!双休!||附岗位要求
  • 教你写一个Vite插件,分析你的项目打包产物体积,带图表的~
  • 大模型「进化手册」:英伟达这次终于放大招了!
  • SpringCloud 微服务迁移到 Kubernetes 容器化完整流程
  • 不要小看Redis,真的强!!
  • ChatGPT入门指南:一文了解如何获取GPT4账号及AI绘图应用