Meta 重磅发布最强开源大模型 Llama 3,扎克伯格:我们要超过所有人!

整理 | 王轶群
责编 | 唐小引出品丨AI 科技大本营(ID:rgznai100)

4 月 19 日凌晨,Meta 重磅发布了全球最大开源大模型 Llama 3,一夜间重新坐稳王者之位。

模型下载链接:https://llama.meta.com/llama-downloads/

GitHub项目地址:https://github.com/meta-llama/llama3

当地时间 4 月 18 日,Meta 发布两款开源 Llama 3 8B 与 Llama 3 70B 模型,供外部开发者免费使用。Meta 表示,Llama 3 8B 和 Llama 3 70B 是目前同体量下,性能最好的开源模型。

Meta 官方博客写道:“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”测试结果显示,Llama 3 8B在某些测试集上性能比 Llama 2 70B 还要强。

在 Llama 3 发布后,小扎向外媒表示,“我们的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。”

圈内大佬齐喝彩!

Llama 3 的发布,开启了一波梦幻联动。传奇研究员、AI 开源倡导者吴恩达发帖表示,Meta 在自己生日当天发布了 Llama 3,这是最棒的生日礼物!谢谢Meta!

Meta 的首席AI科学家杨立昆也击鼓庆祝:

 

 

Meta 生成式AI 团队主管、苹果前高管艾哈迈德·阿尔·达勒(Ahmad Al-Dahle)发帖介绍:

此外,此前凭借 1000 行 C 语言代码、一台 Mac 就训练出 GPT-2 的 AI 大牛 Karpathy 也发帖祝贺:

 

昨夜,重磅发布的 Llama 3,让开源大模型圈内如此热闹,可谓一个不眠之夜。

被大佬们热捧的 Llama 3 的实力究竟如何?

最强开源大模型 Llama 3

Llama 3 的亮点和特性如下:

  • 基于超过 15T token 训练,大小相当于 Llama 2 数据集的 7 倍还多;

  • 训练效率比 Llama 2 高 3 倍;

  • 支持 8K 长文本,改进的 tokenizer 具有 128K token 的词汇量,可实现更好的性能;

  • 在大量重要基准测试中均具有最先进性能;

  • 增强推理和代码能力;

  • 安全性有重大突破,带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具,还能比 Llama 2 有更好“错误拒绝表现”。

根据 Meta AI 的工程师 Aston Zhang 透露,Llama 3 的诞生始于去年夏天,团队攻克了数据集,预训练等方面的一系列难题。他还进一步透露,Llama 3 之后还会解锁新的能力——更长的上下文,支持多模态,性能更强的 400B 版本。

Meta 展示的基准测试结果包括 MMLU、ARC、DROP、GPQA(生物、物理、化学相关的问题集)、HumanEval(代码生成测试)、GSM-8K(数学应用测试)、MATH(同为数学相关基准测试)、AGIEval(问题解决的测试集)以及BIG-Bench Hard(常识推理测试)。

如下图所示,Llama 3 8B 的成绩在九项测试中领先同行。但 Mistral 7B(2023年9月发布)和 Gemma 7B 已经不算最前沿的开源模型。并且在引用的一些基准测试里,Llama 3 8B 的得分最高。

在 MMLU、HumanEval 和 GSM-8K 上,Llama 3 70B 击败了 Gemini 1.5 Pro。尽管无法与 Anthropic 性能最强的模型 Claude 3 Opus 媲美,但 Llama 3 70B 的性能,已经优于 Claude 3 系列的中等模型 Sonnet。

Meta 还测试了 Llama 3 在真实世界场景中的性能,专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取、角色/人物角色、开放式问题解答、推理、改写和总结)。

在 Meta 组织的人类反馈评分中,Llama 3 70B 打败了 Mistral、OpenAI、Claude 发布的对应产品。

小扎专门发了个视频介绍 Meta AI 和 Llama 3,他表示:

我们的目标是打造世界领先的人工智能。我们正在用最先进的新 Llama 3 Al 模型升级 Meta Al,该模型已开源。凭借这个新模型,我们相信 Meta Al 现在是最智能的人工智能助手。你可以自由使用。

我们将 Meta Al 集成到顶部的搜索框中,使其更易于使用 WhatsApp、Instagram、Facebook 和 Messenger。我们还建立了一个网站,meta.ai,供你在网络上使用。

我们还构建了一些独特的创作功能,例如将照片制作成动画的功能。现在AI生成高质量图像的速度非常快,可以根据你的需要实时创建和更新它们,它还将生成你的创作过程的回放视频。

享受 Meta Al,让我知道你的想法!

Meta AI 项目地址:https://ai.meta.com/blog/meta-llama-3/

目前,HuggingChat也已开放体验,需要手动切换至Llama 3。

Hugging Face 地址:https://huggingface.co/chat/

不止如此,还有王炸

不仅如此,在未来几个月内,Meta 还会推出更多的版本。

Meta 官方表示,Llama 3 8B 和 70B 模型只是 Llama 3 系列模型的一部分,他们后续还将推出更多版本,包括模型参数超过 400B 的 Llama 3 版本(目前仍在训练中)。

英伟达高级科学家 Jim Fan 发帖表示:之后可能会发布的 Llama 3-400B 以上的版本其将成为某种“分水岭”,开源社区将能用上 GPT-4 级别的模型。

 

Meta 官方表示,在接下来的几个月中,他们预计将推出新功能(如多模态)、更长的上下文窗口、更多不同大小版本的模型和更强的性能,以及 Llama 3 研究论文。

另外,Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上提供,并得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 硬件平台的支持。

此外,基于 Llama 3,Meta 也发布了他们的全新 AI 助手 Meta AI。

Meta今天发表一篇论文《Imagine Flash:利用逆向蒸馏加速Emu扩散模型》。Imagine Flash 是一个创新的加速扩散模型框架,通过 Imagine Flash 技术可以将50步的生成步骤精简至仅1至3步,达到了实时生图的效果,同时还能提升图像的质量和保真度。该技术已经应用到了Meta AI聊天机器人当中。

Meta 表示,“得益于我们在 Llama 3 上取得的最新进展,Meta AI 比以往任何时候都更智能、更快速、更有趣。”

众神听令,王者回归!

Llama 2 发布后,仅在几个月内就带动了开源社区冒出了众多性能强大的开源模型。开源社区的竞争格局,发生巨变。当有人怀疑,Meta还能否继续在激烈地竞争中保持领先时,Meta 用 Llama 3,让自己重回开源社区的王座。

后续更多版本的发布,是否能让 Meta 长期坐稳王座?我们拭目以待。

推荐阅读:

两家知名云服务商遭诈骗 350 万美元,黑客挖矿赚取 100 万美元后被抓!

退休一天后,波士顿动力宣布:人形机器人 Atlas 以全新电动化状态“复活”!

李彦宏:开源模型会越来越落后,自然语言将成为新的通用编程语言

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。

相关推荐

  • “封杀 AI 生成的代码”,Linux 一个社区采取行动!
  • AIGC开卷3D视频生成,关于生成式AI赛道的三大思考
  • 华为又招了一名天才少年。。
  • 红杉、深创投看好,深圳的明星公司要IPO了
  • 今日代码大赏 | 统一结果返回类
  • 看完马云的简历,我明白了为什么他对钱没有兴趣。。
  • 偷偷分享下我们公司的研发规范~
  • MacBook最佳扩容方案:成本低、人人都能操作
  • 邀请函 | Pulsar Meetup 深圳 2024
  • 为什么公共云的弹性能力很难被发挥出来?
  • 用Rust开发跨平台游戏是怎样的体验?
  • 训练数据平衡时模型的不公平现象该如何解释?模型公平性的几何给出解决方案!
  • 38.9k star,这款 Java 反编译工具很强大!
  • MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜
  • 5亿个token之后,我们得出关于GPT的七条宝贵经验
  • CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务
  • 开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
  • 下接万卡集群、上连AI原生应用,操作系统的进化超出你的想象
  • 指标体系与大模型结合的最新进展与效果分析
  • 奇富科技朱杰:金融风控技术成熟度曲线全面解读