出品 | OSC开源社区(ID:oschina2013)
北京大学知识计算实验室联合四川天府银行 AI 团队,正式开源 70 亿参数的代码大模型 CodeShell,并提供了与 CodeShell 配套的部署方案与 IDE 插件,具体查看 CodeShell 代码库(https://github.com/WisdomShell/codeshell)。
官方介绍称,CodeShell 具有 70 亿参数,采用五千亿 Tokens 进行了训练,上下文窗口长度为 8192。CodeShell 的原始训练数据基于自己爬取的 GitHub 数据、Stack 和 StarCoder 数据集,以及少量高质量的中英文数据。
在权威的代码评估 Benchmark(HumanEval 与 MBPP)中,CodeShell 取得同等规模最好的性能。
本次开源的模型如下:
CodeShell Base:CodelShell 底座模型,具有强大的代码基础能力。
CodeShell Chat:CodelShell 对话模型,在代码问答、代码补全等下游任务重性能优异。
CodeShell Chat 4bit:CodelShell 对话模型 4bit 量化版本,在保证模型性能的前提下内存消耗更小,速度更快。
CodeShell CPP:CodelShell 对话模型 CPP 版本,支持开发者在没有 GPU 的个人电脑中使用。注意,CPP 版本同样支持量化操作,用户可以在最小内存为 8G 的个人电脑中运行 CodeShell。
下图是 CodeShell 代码助手的 VS Code 插件截图:
IDEA 插件:
往期推荐
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦