零一万物回应“套壳 Llama”争议：基于 GPT 研发，对模型和训练的理解做了大量工作

作者 | 褚杏娟

11 月 14 日，李开复旗下 AI 企业零一万物开源大模型 Yi-34B 被指责完全使用 LLaMA 的架构，只对两个张量 (Tensor) 名称进行修改。

对此，零一万物表示：GPT 是一个业内公认的成熟架构，Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构，借鉴了行业顶尖水平的公开成果，由于大模型技术发展还在非常初期，与行业主流保持一致的结构，更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作，也在持续探索模型结构层面本质上的突破。

此事起源于贾扬清在朋友圈的一个吐槽，贾扬清提到，有个“大厂新模型 exactly 就是 LLaMA 的架构，但是为了表示不一样，把代码里面的名字从 LLaMA 改成了他们的名字，然后换了几个变量名。然后，海外有工程师直接指了这一点出来... 还有人在 HF 上面放了个把名字改回去的 checkpoint，说好了，现在你们可以直接用 LLaMA 的代码来 load 这个 checkpoint 了”。

一时间，大家纷纷猜测这个基于 Llama 魔改的大模型到底是哪个。贾扬清随后专门留言表示不是自己的老东家阿里的。后来，有人扒到 Hugging Face 社区的 Yi-34B 项目下讨论区的留言，留言指出，“除了两个张量被重新命名外，Yi 完全使用了 Llama 的架构。”

有网友评论称，“如果他们使用了确切的 Meta LLaMA 结构、代码库和所有相关资源，则还需要遵守 LLaMA 规定的许可协议。要求以 LLaMA 形式正式发布 Yi 模型是有问题的，因为它破坏了 Yi 许可条款的可执行性。”

点击底部阅读原文访问 InfoQ 官网，获取更多精彩内容！

零一万物回应“套壳 Llama”争议：基于 GPT 研发，对模型和训练的理解做了大量工作

相关推荐