北大开源代码大模型CodeShell,提供了配套的IDE插件

出品 | OSC开源社区(ID:oschina2013)

北京大学知识计算实验室联合四川天府银行 AI 团队,正式开源 70 亿参数的代码大模型 CodeShell,并提供了与 CodeShell 配套的部署方案与 IDE 插件,具体查看 CodeShell 代码库(https://github.com/WisdomShell/codeshell)。

官方介绍称,CodeShell 具有 70 亿参数,采用五千亿 Tokens 进行了训练,上下文窗口长度为 8192。CodeShell 的原始训练数据基于自己爬取的 GitHub 数据、Stack 和 StarCoder 数据集,以及少量高质量的中英文数据。

在权威的代码评估 Benchmark(HumanEval 与 MBPP)中,CodeShell 取得同等规模最好的性能。

本次开源的模型如下:

  • CodeShell Base:CodelShell 底座模型,具有强大的代码基础能力。

  • CodeShell Chat:CodelShell 对话模型,在代码问答、代码补全等下游任务重性能优异。

  • CodeShell Chat 4bit:CodelShell 对话模型 4bit 量化版本,在保证模型性能的前提下内存消耗更小,速度更快。

  • CodeShell CPP:CodelShell 对话模型 CPP 版本,支持开发者在没有 GPU 的个人电脑中使用。注意,CPP 版本同样支持量化操作,用户可以在最小内存为 8G 的个人电脑中运行 CodeShell。

下图是 CodeShell 代码助手的 VS Code 插件截图:

IDEA 插件:

往期推荐



有奖问答 | 大数据时代下机器学习的新范式美国政府限制向中国出口NVIDIA H800 GPU
大神用Scratch手搓RISC-V模拟器,成功运行Linux内核



这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦

相关推荐

  • Hugging Face被限制访问
  • 云原生 IDE 将成为常态
  • 10个解放双手的 IDEA 插件,这些代码真不用手写
  • 英伟达开源新Agent!用了GPT-4后,机器人把转笔、盘核桃都玩明白了
  • 推特爆火!超越ChatGPT和Llama2,新一代检索增强方法Self-RAG来了
  • 聊聊昨日ChatGPT全球宕机事件,带给我们的警示
  • 一笔卖了95亿的山东博士火了
  • 我们公司的官网上线了!
  • 通用大模型引领全球创新风潮,谁将为你揭示未来科技的奥秘?
  • 1024程序员节暨「源聚一堂」开源技术沙龙(北京站)火热报名中
  • 数据分析入门:统计学基础知识总结
  • ​ChatGPT 系列研究报告(50个PDF),建了一个资料分享微信群
  • CPU&GPU天梯图(2023年最新版)
  • 支付宝芝时序图欺诈挖掘框架详解
  • AIGC时代的业务与数据,有哪些新要求?
  • 轻松利用日志动态分析平台玩转Nginx运维管理
  • 老黄最新专访:时间倒流30岁,我绝对不会创办英伟达!
  • Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动
  • 超全!我常用的70个数据分析网址
  • 一段话让模型自曝「系统提示词」!ChatGPT、Bing无一幸免