来到2024年,大模型领域的“千模大战”还在继续。开源模型的参数从几百亿来到几千亿,而闭源模型也在不断沿着Scaling Laws(尺度定律)路径升级,在千亿参数的基础上攀登万亿。
图:不同大模型的参数规模
同时,经过2023年的疯狂泡沫期,2024年大模型厂商需要着手解决商业化落地的问题了。但大模型落地时,模型参数量的增加造成模型的存储和计算需求的增加,这给模型的部署和应用带来了不小挑战。因此,模型压缩成为了一个重要的研究方向。
模型压缩技术采用如量化和稀疏等策略,优化了深度神经网络的部署效率。实际上,无论是大型语言模型、扩散模型还是多模态大型模型,它们的成功部署都依赖于模型压缩技术。
为了帮助大家深入理解模型压缩的基础知识,掌握关键技术,并探索在实践中的应用,以实现模型的高效压缩,本次深蓝学院联合业界领先团队——商汤科技模型工具链团队,精心打造了“大模型工具体系”系列公开课。此次公开课共4场,且全免费,旨在为各位伙伴提供一个全面学习模型压缩的平台。除此之外,本次公开课将为大家限时开放专属社群,和同行一起探索大模型压缩的奥秘!
扫码添加,备注【0424】加入专属社群领取课件、论文 — 1 —课程内容四场公开课将深入探讨模型压缩领域的最新研究成果和实践经验,从理论到实践,一步步揭开大模型压缩的神秘面纱。首场公开课将于4月24日晚8点举行,由CVPR2024(Highlight)的优秀论文作者张鑫杰博士主讲,他将带来一场关于视频理解和生成的革命性探索。这项研究不仅在学术界引起了广泛关注,也为实际应用中的模型压缩提供了新的思路和方法。通过四场公开课,带领大家全面了解模型压缩的最新进展,无论你是AI领域的研究者、工程师,还是对这一领域感兴趣的学生,都能在这里获得宝贵的知识和启发。立即预约,加入我们,陆续解锁大模型工具体系公开课,开启大模型压缩之旅!一起见证AI技术迈向更高效、更智能的未来。 — 2 —课程报名深蓝学院携手商汤科技,诚挚邀请您的加入,请扫描图中二维码,加入社群,领取相关论文和课件资料!扫码添加,备注【0424】加入专属社群领取课件、论文