GPT-4 时代落幕,AI 新巨头 Claude 3 发布

大家好,我是大全。一个专注于输出 AI+ 提示词内容的前喜马拉雅架构师,全国最大 AI 付费社群初创合伙人及航海教练,关注我一起进步。

大半夜的搞事情,又是一个AI 界的重磅消息。

Claude3,由Anthropic这家OpenAI的姊妹公司推出,正式发布了。

一种非常低调方式,无发布会,无繁杂宣传,仅在X社交平台上以一条简短的帖子告知世界。



消息虽简,其背后的意义却非同小可。

Claude3系列推出了三个版本:Claude 3 Opus、Claude 3 Sonnet、Claude 3 Haiku,名字背后各自承载着独特的意涵。



"Opus"象征着史诗般的壮丽,

"Sonnet"代表着十四行诗的精致,

"Haiku"则是日式三行诗的简约。

这三者的设计初衷很简单——就是强大的程度,分别对应超大杯、大杯、中杯的不同需求。



细节并不是本次讨论的重点,通过一组简单对比图便能清晰地看出各自特色。



最引人注目的是,Claude3的Opus版本在多个领域实现了对GPT4的全面超越,尤其是在零次提示(0-shot)场景下更是如此。

以多语言数学推理测试为例,Claude3 Opus在没有任何的示例提示情况下,准确率高达达到了90.7%,而GPT4即便给予了八个示例,准确率也仅为74.5%。

这不仅展示了Claude3在推理任务上卓越能力,还彰显了其在语言和知识测试中与GPT4的接近水平,标志着其推理能力显著进步。

然而,让人叹息的是,尽管Claude3极具吸引力,但其高端版本Opus仅对付费会员开放,需要支付20美元方可使用。

经过简单的测试,总结出Claude的三大特点:无与伦比的推理能力、与GPT4持平的多模态表现、以及针对200K长文本的优化处理。

二、初体验和 GPT4 对比

目前大全简单尝试了一下,没想到虽然可以使用但是只有几免费的机会。



我们先看看最新的数据集,依然停留才 2023 年 8 月:



GPT4 以其多模态功能,成为了许多用户不可或缺的工具之一。

近期,Claude3亦升级了其视觉能力,新增了直接处理图像的功能。

官方发布的数据表明,Claude3在视觉能力上与GPT4基本持平。


简单看下大全测试的结果,先是视觉能力,这里也可能是大全表达的不清楚?



暂时没有完成我的任务,来看看 GPT4 的表现:


再看看打开这个代码之后的效果:



至少主体看没啥大的问题,这里GPT4 略胜,也可能是大全表达的不清楚。

我们再来看一个图片理解能力的例子:


接着是 GPT4 的表现:



大家看到回答了吗?我倒是更喜欢 GPT4 的回答,至少这个回答是我心中的答案。

因为只有三次测试机会,所有也只能测试到这里了😂。

这里我们可以再看看其他的测试,大家感受一下:



三、再说几句:

Claude3 还有一些改进,我们再简单说下。

大家再看下Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku的区别。



一眼就能看明白,牛逼的更贵,便宜的更快。

准确度提升

与 Claude 2.1 相比,Opus 在这些挑战性的开放式问题上的准确率提高了一倍,同时错误答案的频率也有所下降。

不仅提高了回答的可信度,还将很快在 Claude 3 模型中加入引用功能,使其能够指向参考材料中确切的句子以验证答案。


长期上下文处理和近乎完美的记忆能力

Claude 3 模型家族一开始将提供200K的上下文窗口。而且,所有三种模型均能处理超过一百万tokens的输入。

Claude 3 Opus 不仅实现了近乎完美的记忆能力,准确率超过99%,有时甚至能识别出评估方法本身的局限,例如识别某些“针”句子似乎是人为加入到原文中的。


再次总结下三个特点:

无与伦比的推理能力、

与GPT4持平的多模态表现、

针对200K长文本的优化处理。

无疑,这使其成为了当前市场上最为强大的大型模型。

不过 OpenAI 也可能不会对此次更新无动于衷。



期望OpenAI能迅速回应,发布GPT5,对 Claude3 进行“狙击”啊。

激烈的竞争,加速迎接我们的未来,我已经迫不及待了。

未来已至...


老规矩,学废了点个赞或在看呀~


 2

 AI 信陪伴领取价值399元的神秘 AI 大礼包
是大全一所 211 大学有 50+访10名 AI 和 Sora 者,专注于 AI 提示词领域AI大全的愿景是成为 AI 提示词的布道者,带领 10 万小白入门 AI 和 Sora,让更多的人在大全这里掌握 AI 提示词的能力,在已经到来的 AI 时代不掉队,不被 AI 淘汰。扫码免费加入我的 AI 星球,邀请了很多大佬会分享很多 AI 学习干货,可领价值 999 元 AI 学习福利🎁


我就知道你“在看”


相关推荐

  • GPT4.0+MJ绘图!永久使用资格!限时领取!
  • 单核QPS提升10倍,亿级日调用!QQ频道前端网关升级之路
  • 工作中常用的6种设计模式
  • 开源的 Sora 复现方案,成本降低近一半!
  • 分享 5 个 用于前端的 Python 库
  • 转行、升职、加薪就靠 Python-100-Days了
  • 《大型多模态智能体》综述
  • 全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类
  • [开源]一套为中小电商企业构建的简单实用第三方平台订单处理系统
  • Hive性能优化(全面)
  • 185道大数据面试真题,给你!
  • springboot第63集:Netty,docker,elasticsearch,kibana一文让你走出微服务迷雾架构周刊
  • 阿里被曝领投MiniMax;英伟达跻身全球市值TOP3;OpenAI AGI时间表疑似泄露丨AIGC大事日报
  • 制衡OpenAI,Claude 3给AI创企吃了颗定心丸
  • 大模型火遍两会!雷军等20位代表热议AI,Sora高频出场,靳东深感受影响
  • CVPR 2024满分论文解读:基于可变形三维高斯的高质量单目动态重建新方法
  • 开源模型知识编辑黑盒大模型:北邮联合美团提出postEdit
  • 大模型微调新范式:当LoRA遇见MoE
  • 粥左罗:2024年还想靠自媒体赚钱,关键在这六点
  • 每日 Prompt:纸雕,宗师