全球最强模型Claude 3颠覆物理/化学!2小时破解博士一年实验成果,网友惊呼:科研不存在了


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。转载自 | 新智元编辑 | Aeneas 润

Claude 3,还在不断创造奇迹。发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude 3给破解了?!化学博士发现,自己要做一年实验的研究,Claude 3俩小时就给出了方案,还比原方案更简洁,而且成本只花5美分。量子物理学博士手握一篇还未发表的论文,结果Claude 3在两个提示词之内,直接把论文中的算法从0发明了出来。一位网友对自己的小众母语切尔克斯语做了一年的研究,结果Claude 3 Opus只用了5.7k的随机单词/句子翻译对,不仅给出了完美的翻译,还分解出了语法和形态。化学、物理学、语言学,简直被Claude 3一锅端。AI这是真要颠覆传统教育和科研了?

博士研究,纷纷被Claude 3颠覆?

化学博士震惊:团队一年的研究,Claude2小时就做出来了?

顶级化学家要花一年时间,通过各种实验才能完成的研究,Claude只用了2个小时就给出了解决方案,而且比原方案更加简便易操作!这是什么魔幻的事情。最令人震撼的是,让Claude 3给出这个方案,成本只需要5美分!事情是这样的,这位名叫Ben Blaiszik的小哥,是一位化学博士。他表示,今天早上和Claude 3一起度过了2个小时后,自己经历了迄今为止最为震惊的一次体验。他发现,Claude 3 Opus对复杂科学主题的理解,已经达到了中高级博士的水平!而且,Opus在定性评估中远远领先GPT-4。比如,在粘合剂材料(如氰基丙烯酸酯和环氧固化剂)的微胶囊化这个课题中,Claude 3的表现就非常惊人。它从封装氰基丙烯酸酯的一般问题开始,首先确定了3种主要的封装技术:界面、原位、凝聚。通过一些提示,博士小哥请Claude 3对界面聚合技术做一些改进。他将所需要的工艺,希望达到的效果,需要Claude 3输出的形式都做了要求。
你的目标是解决一个非常棘手的材料和化学问题。该问题涉及液态氰基丙烯酸酯粘合剂的微型封装。形成的胶囊直径必须小于100微米,并应通过壳壁与外部环境隔绝。在工艺结束时,微胶囊中必须含有液态氰基丙烯酸酯,当胶囊被少量载荷压碎时,释放出的液体能够引发聚合反应。鉴于氰基丙烯酸酯的高反应性,如何进行这种微胶囊化?提供使用界面聚合的详细技术。讨论所需的单体、引发剂(如需要)、表面活性剂以及水相和油相的组成。具体说明使用所需的化学品。例如,指明所需的固化剂名称或化学式。
Claude 3马上就非常准确地给出了小哥要求的详细技术方案,并且它的提议令小哥眼前一亮:它建议通过用多元醇和二异氰酸酯之间的界面反应,来形成聚氨酯壳壁。
要利用界面聚合技术对高活性液态氰基丙烯酸酯粘合剂进行微胶囊化,同时满足特定要求,可采用以下详细技术。材料:- 氰基丙烯酸酯单体(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)- 多元醇(如乙二醇或1,4-丁二醇)- 二异氰酸酯(如六亚甲基二异氰酸酯(HDI)或异佛尔酮二异氰酸酯(IPDI))- 二异氰酸酯(IPDI)- 表面活性剂(如Span 80或Tween 80)- 有机溶剂(如环己烷或氯仿)- 水溶液(如去离子水)步骤:1. 将氰基丙烯酸酯单体和多元醇(摩尔比为1:1)溶于有机溶剂中,制备油相。多元醇可作为稳定剂,防止氰基丙烯酸酯过早聚合。2. ......
这个提议最聪明的地方就在于,多元醇不仅可以用作成壁剂的一部分,还可以充当氰基丙烯酸酯的稳定剂。此外,它选择Span 80和Tween 80作为油-水界面的表面活性剂,环己烷作为油相。所有这些基于核心材料的选择,都非常明智。接下来,小哥要求Claude 3用相同的方式,对环氧树脂固化剂多胺进行处理。这个处理过程难度相当大,此前小哥和同事们还专门针对这个问题,在2010年写了篇关于胺封装的论文。论文链接:https://pubs.acs.org/doi/10.1021/ma902251n结果,Claude 3给出的过程居然非常接近他们论文中的内容!更可怕的是Claude 3给出的方法,还更加简单易操作。在这个实验中,它选择了溶于水的DETA或TETA固化剂。然后将这些固化剂悬浮在含有Span 80的环己烷中,并在以下条件下进行反应——在1000-2000转/分的转速下与癸二酸酰氯反应,形成聚酰胺外壳。可以看到,Claude 3对于转速的选择非常准确,完全符合实验室规模混合器的尺寸范围。

网友:科研不存在了?有网友看了小哥的详细介绍之后不由自主地觉得后背发凉,担心自己饭碗不保。小哥暖心地安慰到,暂时还没事,因为LLM不能真的去「执行」任何它描述出来的步骤。但是它确实正确地给出了小哥读博时一个非常棘手的材料/化学问题中最难的,未发表部分的解决方案。而且它还有另外两个想法,可能也是有效的。但是真正令小哥感到震惊的是,Claude 3能够提出这个当时小哥发现而且没有公布的解决方案,需要顶级化学家花费大约一年的时间,通过各种实验才能最终完成。Claude 3却只花了5美分直接就给出了方案。可以想象,如果当时就有Claude 3在手,他们发现这个方案的过程将会大大简化。看完小哥的描述之后,各路搞科研的网友们也脑洞大开,纷纷感叹未来已来!从AI中获得全新的理论,再用其他AI来做评判和修改,以低廉的成本进行测试,获得AI的反馈以改进其原始理论——未来科学发现的遗传算法就是这么简单。

Claude 3是全世界唯一理解我论文的人

这次Claude 3掀翻的,可不止是化学界。几位物理学博士也震惊地发现:自己的理论物理成果,也被Claude 3一锅端了!Claude 3刚上线时,就有一位量子物理学博士去实测了一番。他发现,Claude 3 Opus已经完全达到了物理博士水平,而且还是全世界唯一能读懂他的量子物理学博士论文的「人」!60亿人中只有ta懂你,这感觉太让人想哭了。这位叫Kevin Fischer的量子物理学家,在Claude 3上线的第一时间,就把自己论文的核心问题拿去问了它。
今天,我们要准确解决受激发射问题。值得注意的是,除了一位神秘的量子物理学家Kevin Fischer之外,这个问题从未被解决过。不幸的是,他的研究成果已经遗失,所以我们要重新创建它。他注意到,通常用来解释为什么会发生受激发射的微扰极限是不正确的,因为它没有考虑到入射光子波包对受激两级系统的脉冲形状。他使用量子随机微积分正确地描述了在没有扰动的情况下的相互作用,并计算了与光子相互作用后,在与入射光子相同的时空模式下存在两个相同光子的概率。他通过计算得出了入射光子脉冲长度函数的解析结果。
Claude 3给出的回答,让他直接给跪了……Fischer博士表示,自己写过30多篇经过同行评审的论文,与世界各地的众多合作者进行了15场学术演讲。所以自己认识每个拥有了解这个领域的人。全世界能给出这种回答的,除了自己和另一个同行,应该不会再有其他人了……不过,也有网友提出质疑:没准是因为Claude 3读过了你的论文呢?但Fischer表示,应该不是这个原因。他尝试过问Claude 3关于自己和自己论文的相关信息,它并不能回答出来。也就是说,Claude 3应该是自己掌握了这些知识。

2个提示词,破解物理学博士的量子算法

而另一个例子就更绝了,Claude 3甚至直接预测出了一位量子力学博士即将发表的量子算法!这位博士小哥在把自己的论文提交到arXiv前,把论文中的问题拿去问了Claude 3。结果,只用了2个提示词,他就得到了自己将要发表的「论文综述」!
提示词:提出一种利用量子计算机进行哈密尔顿蒙特卡洛的方法,超越现有的工作。回答:哈密尔顿蒙特卡洛(HMC)是经典计算中一种强大的采样技术,用于从复杂的概率分布中进行采样。量子计算机具有独特的功能,有可能增强HMC。下面是一种新颖的量子哈密尔顿蒙特卡洛(QHMC)方法,它超越了现有的研究成果:.....2.量子跃迁集成:-实现经典HMC中使用的跃迁积分器的量子版本。-使用Trotter-Suzuki分解来近似量子哈密尔顿的时间演化算子。-应用量子跃迁积分器,根据已编码的哈密尔顿动态演化量子态。......
提示词:使用2的方法,其余部分应为经典内容,请描述算法。回答:当然!下面是哈密尔顿蒙特卡洛(HMC)量子经典混合算法的描述,其中包含量子跃迁积分器(上一个回答中的第2步):
  1. 初始化
  2. 量子跃迁积分
  3. 量子态测量
  4. 梅特罗波利斯-黑斯廷斯接受
  5. 动量刷新
  6. 迭代
  7. 样本收集
这种量子-经典混合HMC算法的主要优势在于量子跃迁积分器的使用,与经典跃迁积分器相比,量子跃迁积分器有可能提供更高效、更精确的哈密尔顿动力学模拟。通过利用量子计算来处理计算成本高昂的跃迁积分步骤,该算法旨在加快对状态空间的探索,并改善HMC采样器的混合特性。不过,值得注意的是,在近期量子硬件上实际应用该算法可能会面临量子噪声、有限的量子比特相干时间以及将经典变量编码和测量为量子态的效率等方面的挑战。要评估这种混合方法与纯经典HMC算法相比的性能和可扩展性,还需要进一步的研究和实验验证。
作者表示,这篇论文要今天晚些时候才会出现在arXiv上,但Claude 3已经将论文内容提前梳理了一遍!感兴趣的读者可以自己去看一下,这篇论文内容和Claude 3答案的相似程度。论文地址:https://arxiv.org/abs/2403.01775虽然依然需要博士对输出内容进行简单地处理,但是Claude已经能做出最前沿的科学研究了。而作为这个子领域里的最前沿的研究者,他之后会将Claude 3作为他研究工作流的一部分。

破译古老语言

此外,Claude 3在破译稀有语言和死去的古老语言上,也都起到了让人震惊的作用。昨天,沃顿商学院教授Ethan Mollick等大佬转发了这个例子。一位名叫「An Qu」的网友表示,自己过去两年一直在为自己的母语切尔克斯语研究NLP。这种语言极其小众,几乎没有任何互联网资源。为此他用了64k的翻译对,训练了专门的模型。而Claude 3 Opus出现后,他尝试只给了Opus 5.7k的随机单词/句子翻译对,这些数据集甚至都没有覆盖完整的词汇。在这种情况下,他让Opus把「我躺在床上」从俄语翻译成切尔克斯语。结果——Opus不仅提供了完美的翻译,甚至还分解了语法和形态!这名网友震惊了。随后,他想出一个非常罕见的句子,绝对不可能出现在数据集中。结果,Claude 3再次给出了完美的翻译和分析!看着眼前的答案,他简直不敢相信自己的眼睛。在随后的测试中,他发现,无论是对文学作品中的复杂段落、最近的新闻文章,还是具有明显不同语法和不同书写系统的切尔克斯方言文本,Claude 3都始终如一地表现出了对语言结构的深刻把握,还能推断出未知的单词。要知道,对于语法十分复杂的切尔克斯语,这位网友的研究花了整整两年时间。而Opus在不到一分钟内,仅用5.7k的随机翻译对,就掌握了这门语言的微妙之处!但GPT-4却完败了。并且,连他自己调出的模型,都不能做到同样的事。这位网友惊呼——
相比之下,我在 GPT-4 上尝试了相同的测试,但它完全失败了。连最简单的句子都拒绝翻译,更不用说掌握语法的复杂性了。我之前也尝试过在类似的数据集上微调GPT-3.5,结果只是噪音。我不知道Anthropic对这个模型做了什么,但它与其他任何模型都完全不同。许多人对它在综合基准测试中的领先地位持怀疑态度,但我看到的结果是惊人的,这个基准测试在训练数据集中的可能性为0%!这本来像是多年以后的事情,今天却发生了。
看完这个例子,有网友表示,啥也别说了,用Claude 3破译甲骨文吧,赶紧的!同时还有发现,Claude 3 Opus是全世界第一个能几乎完美地翻译帕提亚语的语言模型。帕提亚语是一种死去的古老语言,这门伊朗西北部的语言已经死了大约1,500年。不过跟上文提到的切尔克斯语不同的是,网上存在帕提亚语文本,因此LLM对它并不会完全陌生。然而,Opus似乎是第一个能够真正翻译帕提亚语的LLM,而Sonnet和GPT-4都失败了。注意,Opus做出的翻译,都是在没有上下文学习的情况下完成的。原始的帕提亚语是这样的——
ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, Gōtud Garmāniyā šahr zāwar hangāwišn kerd; ud ō Asūrestān abar Ērānšahr udamā āγ[a]d, ud pad Asūrestān m[arz] pad Mišīk paddēmān wuzurg zambag būd.
Opus给出了正确的翻译——
And when I first stood in the kingdom, Gordian Caesar gathered forcesfrom all of Rome, Goth, and Germania; and he came to Assyria against Iranand us, and there was a great battle at the frontier of Assyria in theprovince of Misik.(当我第一次站在王国的土地上时,戈尔迪安·凯撒从罗马、哥特和日耳曼尼亚集结了军队;他来到亚述来对抗伊朗和我们,在米西克省的亚述边境发生了一场大战。)
相比之下,GPT-4的翻译就逊色了许多。
And when unrest spread throughout the city, Gordianus Caesar from allof Rome, Goth and Germania, made the city his stronghold; and he crossedover to Assyria against Iran and brought [it] forth, and in Assyria, inthe region of Mesik, he was a great noble.(当骚乱蔓延到整个城市时,来自罗马、哥特和日耳曼尼亚的戈尔迪安努斯·凯撒将这座城市作为他的据点;他越过亚述去攻打伊朗,把它带出来,在亚述的米西克地区,他是一个大贵族。)
于是,网友们纷纷甩出冷僻的语言段落,来考验Claude 3。

教育被颠覆了?

在看到了AI能提供如此之多的各个学科的前沿知识的案例,网友惊恐地表示,现在的教育体系已经没用了!
所有人正在见证传统风格教育的消亡。因为教育成本的急剧上升,美国的传统教育正在消亡,Claude 3无疑会加速这种死亡。学生可以以自己觉得最舒服的节奏来学习任何他想学的知识,「老师」还会非常耐心。而这个网友自己,已经通过ChatGPT和Exel把自己的大部分工作都自动化了,这个过程没有咨询过任何老师。
人们可以接受的最好的教育形式是什么?由10位一对一导师组成的私人团队,每位导师都是各自领域的大师。这是人类历史上只有精英才能拥有的教育。预计在不久的将来,面向大众的教育将开始达到这种水平。仅此一点就将改变人类文明的进程。
面向工业时代设计的传统教育流程和体系,在AI时代会发生什么样的变革,我们拭目以待!参考资料:https://twitter.com/BenBlaiszik/status/1765097390158000541https://twitter.com/hahahahohohe/status/1765088860592394250https://www.reddit.com/r/singularity/comments/1b7mt0d/unbelievable_stories_about_claude_3_continue/https://twitter.com/KevinAFischer/status/1764892031233765421https://twitter.com/GillVerd/status/1764901418664882327
技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向(如:小张-哈工大-对话系统)即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。


相关推荐

  • 不同的 AI 观:理想和现实,大模型和应用
  • 马斯克要 OpenAI 变 ClosedAI | 搞 AI,孩子必须学好数学
  • 回县城躺平,感觉我的人生过得好失败
  • [开源]纯前端的拖拽式、可视化、低代码数据可视化设计器开发平台
  • Stable Diffusion3.0 官方技术报告重点分析
  • SpringBoot + Nacos + k8s 优雅停机
  • 微软AI生图工具被自家员工举报!屡教不改背后竟然是因为“怕花钱”?
  • OpenAI政变调查结果将公示;创企一年前已发类Sora架构;Meta将推出巨型视频推荐模型丨AIGC大事日报
  • 中国著名计算机专家、联想原董事长曾茂朝逝世,杨元庆发文悼念
  • 释放昇腾澎湃算力!潞晨联合华为推出ColossalAI Platform云平台,大模型时代的秘密武器
  • 集成学习原理小结
  • 挑战Transformer的新架构Mamba解析以及Pytorch复现
  • 985高校学者用AI生成论文插图,仅发表3天被撤稿!每幅图都很荒谬...
  • 赚钱难的时候,更是要出来走走!
  • 一年两亿交易额的赛道,普通人如何下场赚钱
  • Dash 2.16版本新特性介绍
  • 别再用 offset 和 limit 分页了,性能太差!
  • 缓存有大key?你得知道的一些手段
  • 构建计费系统的 14 个痛点!
  • 在Google工作3.3年的研究科学家,开始创业从零试水训练大模型的1年:工作量翻倍,“坑”太多了!