全球最强模型Claude 3颠覆物理/化学!2小时破解博士一年实验成果,网友惊呼:科研不存在了


  新智元报道  

编辑:Aeneas 润
【新智元导读】这几天,越来越多博士发现,自己耗费数年心血的研究成果,竟然被Claude 3轻轻松松实现了?化学,物理学,语言学,不断被Claude 3定向爆破,博士手里的论文没发表就被它做出来了。科研还存在吗?

Claude 3,还在不断创造奇迹。发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude 3给破解了?!化学博士发现,自己要做一年实验的研究,Claude 3俩小时就给出了方案,还比原方案更简洁,而且成本只花5美分。量子物理学博士手握一篇还未发表的论文,结果Claude 3在两个提示词之内,直接把论文中的算法从0发明了出来。一位网友对自己的小众母语切尔克斯语做了一年的研究,结果Claude 3 Opus只用了5.7k的随机单词/句子翻译对,不仅给出了完美的翻译,还分解出了语法和形态。化学、物理学、语言学,简直被Claude 3一锅端。

AI这是真要颠覆传统教育和科研了?

博士研究,纷纷被Claude 3颠覆?

化学博士震惊:团队一年的研究,Claude2小时就做出来了?

顶级化学家要花一年时间,通过各种实验才能完成的研究,Claude只用了2个小时就给出了解决方案,而且比原方案更加简便易操作!这是什么魔幻的事情。最令人震撼的是,让Claude 3给出这个方案,成本只需要5美分!事情是这样的,这位名叫Ben Blaiszik的小哥,是一位化学博士。他表示,今天早上和Claude 3一起度过了2个小时后,自己经历了迄今为止最为震惊的一次体验。他发现,Claude 3 Opus对复杂科学主题的理解,已经达到了中高级博士的水平!而且,Opus在定性评估中远远领先GPT-4。比如,在粘合剂材料(如氰基丙烯酸酯和环氧固化剂)的微胶囊化这个课题中,Claude 3的表现就非常惊人。它从封装氰基丙烯酸酯的一般问题开始,首先确定了3种主要的封装技术:界面、原位、凝聚。通过一些提示,博士小哥请Claude 3对界面聚合技术做一些改进。他将所需要的工艺,希望达到的效果,需要Claude 3输出的形式都做了要求。
你的目标是解决一个非常棘手的材料和化学问题。该问题涉及液态氰基丙烯酸酯粘合剂的微型封装。形成的胶囊直径必须小于100微米,并应通过壳壁与外部环境隔绝。在工艺结束时,微胶囊中必须含有液态氰基丙烯酸酯,当胶囊被少量载荷压碎时,释放出的液体能够引发聚合反应。鉴于氰基丙烯酸酯的高反应性,如何进行这种微胶囊化?提供使用界面聚合的详细技术。讨论所需的单体、引发剂(如需要)、表面活性剂以及水相和油相的组成。具体说明使用所需的化学品。例如,指明所需的固化剂名称或化学式。
Claude 3马上就非常准确地给出了小哥要求的详细技术方案,并且它的提议令小哥眼前一亮:它建议通过用多元醇和二异氰酸酯之间的界面反应,来形成聚氨酯壳壁。

要利用界面聚合技术对高活性液态氰基丙烯酸酯粘合剂进行微胶囊化,同时满足特定要求,可采用以下详细技术。

材料:

- 氰基丙烯酸酯单体(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)

- 多元醇(如乙二醇或1,4-丁二醇)

- 二异氰酸酯(如六亚甲基二异氰酸酯(HDI)或异佛尔酮二异氰酸酯(IPDI))

- 二异氰酸酯(IPDI)

- 表面活性剂(如Span 80或Tween 80)

- 有机溶剂(如环己烷或氯仿)

- 水溶液(如去离子水)

步骤:

1. 将氰基丙烯酸酯单体和多元醇(摩尔比为1:1)溶于有机溶剂中,制备油相。多元醇可作为稳定剂,防止氰基丙烯酸酯过早聚合。2. ......
这个提议最聪明的地方就在于,多元醇不仅可以用作成壁剂的一部分,还可以充当氰基丙烯酸酯的稳定剂。此外,它选择Span 80和Tween 80作为油-水界面的表面活性剂,环己烷作为油相。所有这些基于核心材料的选择,都非常明智。接下来,小哥要求Claude 3用相同的方式,对环氧树脂固化剂多胺进行处理。这个处理过程难度相当大,此前小哥和同事们还专门针对这个问题,在2010年写了篇关于胺封装的论文。

论文链接:https://pubs.acs.org/doi/10.1021/ma902251n结果,Claude 3给出的过程居然非常接近他们论文中的内容!更可怕的是Claude 3给出的方法,还更加简单易操作。在这个实验中,它选择了溶于水的DETA或TETA固化剂。然后将这些固化剂悬浮在含有Span 80的环己烷中,并在以下条件下进行反应——在1000-2000转/分的转速下与癸二酸酰氯反应,形成聚酰胺外壳。可以看到,Claude 3对于转速的选择非常准确,完全符合实验室规模混合器的尺寸范围。

网友:科研不存在了?有网友看了小哥的详细介绍之后不由自主地觉得后背发凉,担心自己饭碗不保。小哥暖心地安慰到,暂时还没事,因为LLM不能真的去「执行」任何它描述出来的步骤。但是它确实正确地给出了小哥读博时一个非常棘手的材料/化学问题中最难的,未发表部分的解决方案。而且它还有另外两个想法,可能也是有效的。但是真正令小哥感到震惊的是,Claude 3能够提出这个当时小哥发现而且没有公布的解决方案,需要顶级化学家花费大约一年的时间,通过各种实验才能最终完成。Claude 3却只花了5美分直接就给出了方案。可以想象,如果当时就有Claude 3在手,他们发现这个方案的过程将会大大简化。看完小哥的描述之后,各路搞科研的网友们也脑洞大开,纷纷感叹未来已来!从AI中获得全新的理论,再用其他AI来做评判和修改,以低廉的成本进行测试,获得AI的反馈以改进其原始理论——未来科学发现的遗传算法就是这么简单。

Claude 3是全世界唯一理解我论文的人

这次Claude 3掀翻的,可不止是化学界。几位物理学博士也震惊地发现:自己的理论物理成果,也被Claude 3一锅端了!Claude 3刚上线时,就有一位量子物理学博士去实测了一番。他发现,Claude 3 Opus已经完全达到了物理博士水平,而且还是全世界唯一能读懂他的量子物理学博士论文的「人」!60亿人中只有ta懂你,这感觉太让人想哭了。这位叫Kevin Fischer的量子物理学家,在Claude 3上线的第一时间,就把自己论文的核心问题拿去问了它。
今天,我们要准确解决受激发射问题。值得注意的是,除了一位神秘的量子物理学家Kevin Fischer之外,这个问题从未被解决过。不幸的是,他的研究成果已经遗失,所以我们要重新创建它。他注意到,通常用来解释为什么会发生受激发射的微扰极限是不正确的,因为它没有考虑到入射光子波包对受激两级系统的脉冲形状。他使用量子随机微积分正确地描述了在没有扰动的情况下的相互作用,并计算了与光子相互作用后,在与入射光子相同的时空模式下存在两个相同光子的概率。他通过计算得出了入射光子脉冲长度函数的解析结果。
Claude 3给出的回答,让他直接给跪了……Fischer博士表示,自己写过30多篇经过同行评审的论文,与世界各地的众多合作者进行了15场学术演讲。所以自己认识每个拥有了解这个领域的人。全世界能给出这种回答的,除了自己和另一个同行,应该不会再有其他人了……不过,也有网友提出质疑:没准是因为Claude 3读过了你的论文呢?但Fischer表示,应该不是这个原因。他尝试过问Claude 3关于自己和自己论文的相关信息,它并不能回答出来。也就是说,Claude 3应该是自己掌握了这些知识。

2个提示词,破解物理学博士的量子算法

而另一个例子就更绝了,Claude 3甚至直接预测出了一位量子力学博士即将发表的量子算法!这位博士小哥在把自己的论文提交到arXiv前,把论文中的问题拿去问了Claude 3。结果,只用了2个提示词,他就得到了自己将要发表的「论文综述」!
提示词:提出一种利用量子计算机进行哈密尔顿蒙特卡洛的方法,超越现有的工作。回答:哈密尔顿蒙特卡洛(HMC)是经典计算中一种强大的采样技术,用于从复杂的概率分布中进行采样。量子计算机具有独特的功能,有可能增强HMC。下面是一种新颖的量子哈密尔顿蒙特卡洛(QHMC)方法,它超越了现有的研究成果:.....2.量子跃迁集成:-实现经典HMC中使用的跃迁积分器的量子版本。-使用Trotter-Suzuki分解来近似量子哈密尔顿的时间演化算子。-应用量子跃迁积分器,根据已编码的哈密尔顿动态演化量子态。......
提示词:使用2的方法,其余部分应为经典内容,请描述算法。回答:当然!下面是哈密尔顿蒙特卡洛(HMC)量子经典混合算法的描述,其中包含量子跃迁积分器(上一个回答中的第2步):
  1. 初始化
  2. 量子跃迁积分
  3. 量子态测量
  4. 梅特罗波利斯-黑斯廷斯接受
  5. 动量刷新
  6. 迭代
  7. 样本收集
这种量子-经典混合HMC算法的主要优势在于量子跃迁积分器的使用,与经典跃迁积分器相比,量子跃迁积分器有可能提供更高效、更精确的哈密尔顿动力学模拟。通过利用量子计算来处理计算成本高昂的跃迁积分步骤,该算法旨在加快对状态空间的探索,并改善HMC采样器的混合特性。不过,值得注意的是,在近期量子硬件上实际应用该算法可能会面临量子噪声、有限的量子比特相干时间以及将经典变量编码和测量为量子态的效率等方面的挑战。要评估这种混合方法与纯经典HMC算法相比的性能和可扩展性,还需要进一步的研究和实验验证。
作者表示,这篇论文要今天晚些时候才会出现在arXiv上,但Claude 3已经将论文内容提前梳理了一遍!感兴趣的读者可以自己去看一下,这篇论文内容和Claude 3答案的相似程度。

论文地址:https://arxiv.org/abs/2403.01775虽然依然需要博士对输出内容进行简单地处理,但是Claude已经能做出最前沿的科学研究了。而作为这个子领域里的最前沿的研究者,他之后会将Claude 3作为他研究工作流的一部分。

破译古老语言

此外,Claude 3在破译稀有语言和死去的古老语言上,也都起到了让人震惊的作用。昨天,沃顿商学院教授Ethan Mollick等大佬转发了这个例子。一位名叫「An Qu」的网友表示,自己过去两年一直在为自己的母语切尔克斯语研究NLP。这种语言极其小众,几乎没有任何互联网资源。为此他用了64k的翻译对,训练了专门的模型。而Claude 3 Opus出现后,他尝试只给了Opus 5.7k的随机单词/句子翻译对,这些数据集甚至都没有覆盖完整的词汇。在这种情况下,他让Opus把「我躺在床上」从俄语翻译成切尔克斯语。结果——Opus不仅提供了完美的翻译,甚至还分解了语法和形态!这名网友震惊了。随后,他想出一个非常罕见的句子,绝对不可能出现在数据集中。结果,Claude 3再次给出了完美的翻译和分析!看着眼前的答案,他简直不敢相信自己的眼睛。在随后的测试中,他发现,无论是对文学作品中的复杂段落、最近的新闻文章,还是具有明显不同语法和不同书写系统的切尔克斯方言文本,Claude 3都始终如一地表现出了对语言结构的深刻把握,还能推断出未知的单词。要知道,对于语法十分复杂的切尔克斯语,这位网友的研究花了整整两年时间。而Opus在不到一分钟内,仅用5.7k的随机翻译对,就掌握了这门语言的微妙之处!但GPT-4却完败了。并且,连他自己调出的模型,都不能做到同样的事。这位网友惊呼——
相比之下,我在 GPT-4 上尝试了相同的测试,但它完全失败了。连最简单的句子都拒绝翻译,更不用说掌握语法的复杂性了。我之前也尝试过在类似的数据集上微调 GPT-3.5,结果只是噪音。我不知道Anthropic对这个模型做了什么,但它与其他任何模型都完全不同。许多人对它在综合基准测试中的领先地位持怀疑态度,但我看到的结果是惊人的,这个基准测试在训练数据集中的可能性为0%!这本来像是多年以后的事情,今天却发生了。
看完这个例子,有网友表示,啥也别说了,用Claude 3破译甲骨文吧,赶紧的!同时还有发现,Claude 3 Opus是全世界第一个能几乎完美地翻译帕提亚语的语言模型。帕提亚语是一种死去的古老语言,这门伊朗西北部的语言已经死了大约1,500年。不过跟上文提到的切尔克斯语不同的是,网上存在帕提亚语文本,因此LLM对它并不会完全陌生。然而,Opus似乎是第一个能够真正翻译帕提亚语的LLM,而Sonnet和GPT-4都失败了。注意,Opus做出的翻译,都是在没有上下文学习的情况下完成的。原始的帕提亚语是这样的——
ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, Gōt ud Garmāniyā šahr zāwar hangāwišn kerd; ud ō Asūrestān abar Ērānšahr ud amā āγ[a]d, ud pad Asūrestān m[arz] pad Mišīk paddēmān wuzurg zambag būd.
Opus给出了正确的翻译——
And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.(当我第一次站在王国的土地上时,戈尔迪安·凯撒从罗马、哥特和日耳曼尼亚集结了军队;他来到亚述来对抗伊朗和我们,在米西克省的亚述边境发生了一场大战。)
相比之下,GPT-4的翻译就逊色了许多。
And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, he was a great noble.(当骚乱蔓延到整个城市时,来自罗马、哥特和日耳曼尼亚的戈尔迪安努斯·凯撒将这座城市作为他的据点;他越过亚述去攻打伊朗,把它带出来,在亚述的米西克地区,他是一个大贵族。)
于是,网友们纷纷甩出冷僻的语言段落,来考验Claude 3。

教育被颠覆了?

在看到了AI能提供如此之多的各个学科的前沿知识的案例,网友惊恐地表示,现在的教育体系已经没用了!
所有人正在见证传统风格教育的消亡。因为教育成本的急剧上升,美国的传统教育正在消亡,Claude 3无疑会加速这种死亡。学生可以以自己觉得最舒服的节奏来学习任何他想学的知识,「老师」还会非常耐心。而这个网友自己,已经通过ChatGPT和Exel把自己的大部分工作都自动化了,这个过程没有咨询过任何老师。
人们可以接受的最好的教育形式是什么?由10位一对一导师组成的私人团队,每位导师都是各自领域的大师。这是人类历史上只有精英才能拥有的教育。预计在不久的将来,面向大众的教育将开始达到这种水平。仅此一点就将改变人类文明的进程。

面向工业时代设计的传统教育流程和体系,在AI时代会发生什么样的变革,我们拭目以待!

参考资料:https://twitter.com/BenBlaiszik/status/1765097390158000541

https://twitter.com/hahahahohohe/status/1765088860592394250

https://www.reddit.com/r/singularity/comments/1b7mt0d/unbelievable_stories_about_claude_3_continue/

https://twitter.com/KevinAFischer/status/1764892031233765421

https://twitter.com/GillVerd/status/1764901418664882327




相关推荐

  • 知识图谱与大模型如何协同演进?
  • 大语言模型推理能力在交互中的增强实践
  • Sora揭示视频生成的未来
  • ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
  • 全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
  • Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
  • Sora 时代的 AI 视频生成何去何从?
  • 想搞AI,高中别学数据科学:奥特曼、马斯克此刻终于一致了
  • 「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
  • 中科院等万字详解:最前沿图像扩散模型综述
  • 消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
  • 谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”
  • 马斯克Ilya私密邮件被Claude破译,OpenAI打码信息公开,谷歌很受伤
  • 人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文
  • 程序员疯狂互爆每年薪资变化。
  • 今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优
  • Claude 3 相比 GPT-4 到底强在哪?我整理了一份总结
  • 好家伙!一个 Claude 3 约等于一个本科生...
  • 热搜第一!娃哈哈是高校实验室御用水,曾多次被写进论文里
  • 高校有哪些编制?哪些是高校“假编制”?