值得一试的开源模型!开源社区上季度都有哪些靠谱项目?

在过去的一个季度,社区开源了不少「值得一试」的通用模型,包括 LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B 等语言大模型;LlaVA1.5、VisualGLM-6B、VisCPM、NexT-GPT、Chinese LlaVA、QwenVL 等多模态项目。

在专用任务、领域精调模型方面,开源社区也涌现了一批「值得一试」的精调方案及模型,例如用于代码任务的 CodeLlama、StableCode、WizardCoder等,用于法律任务的 DISC-LawLMM、智海-录问、夫子·明察,用于医疗领域的 DISC-MedLLM、仲景,用于心理领域的Mindchat、MeChat,用于天文领域的StarGLM及用于交通领域的 TransGPT。

值得特别关注的是,这个季度在模型微调、推理加速、Agent 开发方面迎来了一波广受开源社区好评的框架、工具类项目的发布及版本更新,如 LlaMA-Efficient-Tuning、AutoGen 等,老伙计们不妨一试!

  基座模型

项目详情:https://sota.jiqizhixin.com/project/llama-2


项目详情:https://sota.jiqizhixin.com/project/baichuan-2


项目详情:https://sota.jiqizhixin.com/project/chatglm2-6b

项目详情:https://sota.jiqizhixin.com/project/qwen-14b

项目详情:https://sota.jiqizhixin.com/project/internlm

项目详情:https://sota.jiqizhixin.com/project/tigerbot


项目详情:https://sota.jiqizhixin.com/project/xverse-13b


  任务/领域精调模型

项目详情:https://sota.jiqizhixin.com/project/codellama


项目详情:https://sota.jiqizhixin.com/project/stablecode


项目详情:https://sota.jiqizhixin.com/project/wizardcoder


项目详情:https://sota.jiqizhixin.com/project/disc-lawllm


项目详情:https://sota.jiqizhixin.com/project/wisdominterrogatory


项目详情:https://sota.jiqizhixin.com/project/fu-zi-ming-cha



项目详情:https://sota.jiqizhixin.com/project/disc-medllm


项目详情:https://sota.jiqizhixin.com/project/zhong-jing


项目详情:https://sota.jiqizhixin.com/project/mindchat


项目详情:https://sota.jiqizhixin.com/project/mechat


项目详情:https://sota.jiqizhixin.com/project/starglm


项目详情:https://sota.jiqizhixin.com/project/transgpt


  多模态LMMs

项目详情:https://sota.jiqizhixin.com/project/llava


项目详情:https://sota.jiqizhixin.com/project/visualglm-6b


项目详情:https://sota.jiqizhixin.com/project/viscpm


项目详情:https://sota.jiqizhixin.com/project/next-gpt


项目详情:https://sota.jiqizhixin.com/project/chinese-llava


项目详情:https://sota.jiqizhixin.com/project/qwen-vl-tong-yi-qian-wen



  Agent开发

项目详情:https://sota.jiqizhixin.com/project/agents

项目详情:https://sota.jiqizhixin.com/project/agentverse

项目详情:https://sota.jiqizhixin.com/project/autoagents-2

项目详情:https://sota.jiqizhixin.com/project/autogen

项目详情:https://sota.jiqizhixin.com/project/auto-gpt

  微调框架

项目详情:https://sota.jiqizhixin.com/project/peft

项目详情:https://sota.jiqizhixin.com/project/llama-efficient-tuning


项目详情:https://sota.jiqizhixin.com/project/xturing

项目详情:https://sota.jiqizhixin.com/project/llmtune

项目详情:https://sota.jiqizhixin.com/project/deepspeed

项目详情:https://sota.jiqizhixin.com/project/megatron-llm

  推理加速框架

项目详情:https://sota.jiqizhixin.com/project/vllm

项目详情:https://sota.jiqizhixin.com/project/fastllm

项目详情:https://sota.jiqizhixin.com/project/exllamav2


项目详情:https://sota.jiqizhixin.com/project/text-generation-inference


加入社群



相关推荐

  • 字节跳动李航:对语言大模型的若干观察和思考
  • 炸裂,包装三年经验,朋友代替面试,还过了。。。
  • 【高通】宣布大幅裁员
  • 高中同桌,大学毕业后,他去了互联网大厂,我考上公务员。目前,他失业在家
  • 给你看一张触目惊心的截图
  • Redis只能做缓存?太out了!
  • 《一书解决几乎所有机器学习问题》.PDF下载
  • 打造ChatGPT平替,成本暴降95%!OpenAI硬核更新下月发布,视觉API要来
  • 哈佛全奖,师从四院院士,曾火遍全网的“复旦女神”,发完Science,再发子刊!
  • 老刘说知识图谱实践指引:知识图谱代表性全流程开源项目、NER/RE关键模型与开放课程概述
  • Azure Database将陆续终止支持MariaDB
  • JVM 语言比较研究:Java、Kotlin 和 Scala 的利与弊
  • Facebook 的全球网络大揭秘:构建社交帝国的科技奇迹
  • 京东辟谣“刘姓商人涉嫌违法被抓”;比特大陆全员工资暂停发放;一周可居家办公3 天,去哪儿灵活办公制度出炉|Q资讯
  • 这泼天的富贵终于来了,彻底爆单了。。。
  • 前端如何实现原生 JS 的拖拽效果 ?
  • 11年逆袭,寒门专升本职高生终成MIT博士生!自学CMU课狂发5篇顶会,全网热议
  • 键盘侠
  • [开源]基于 Furion + ViewUI 开发的一套极简的进销存管理系统
  • Kaggle大模型比赛冠军方案梳理。