LLM+推荐:训练推理新范式!

大模型推荐有哪些成功的落地经验?

稀疏大模型训练推理如何优化?

荐系统的特征工程如何做?

多源序列建模怎么搞?

融合排序的多目标寻优怎么玩?

6月22日,邀请您参加DataFunSummit2024: 推荐系统架构峰会,共同探讨大模型时代,推荐系统的前沿技术与最新落地经验,感兴趣的小伙伴欢迎识别二维码免费报名,收看直播:

扫码免费报名,收看直播

"高效率的训练推理框架是推荐系统中的关键环节,它直接影响着算法模型的迭代速度和线上服务的响应能力,也唯有在算力+算法的共同加持下才能为亿级用户提供优质的信息服务。此外,大语言模型的崛起不仅带来了 LLM 如何与推荐系统结合落地的广泛讨论,也让处理高维稀疏序列模型的分布式训练推理系统成为了行业焦点。

本次论坛将从 GPU 性能优化、编译优化、框架工具链,LLM 推理等多个方面进行分享,欢迎大家参与讨论。"

—— 姜碧野 阿里巴巴高级算法专家

出品人:姜碧野 阿里巴巴 高级算法专家

个人介绍:碧野博士毕业于加州大学伯克利分校, 目前就职于阿里巴巴,在阿里妈妈广告,高德视觉中心均参与过各类机器学习系统的搭建和优化。曾参与举办icmlviz深度学习可视化,dlp-kdd高维稀疏数据的深度学习workshop。

袁镱 腾讯 专家工程师

个人介绍:袁镱博士,腾讯公司专家工程师,负责无量系统和一念LLM等机器学习训练和推理框架研发。

演讲题目:大语言模型推理加速

演讲提纲:

1. 基本逻辑:大语言模型推理基本逻辑和常规深度学习推理的差异

2. 性能瓶颈分析:大语言模型推理特定的性能瓶颈

3. 性能优化:业界主要的优化方法,结合腾讯开源的一念LLM分析推理系统的技术选型

听众收益:

1. 系统地了解大语言模型推理的基本逻辑和优化方法

2. 在一个简单的分析框架下,了解当前多种多样的方法是在哪些维度上优化


李健 京东 算法应用工程师

个人介绍:17年加入京东广告研发部,在算法架构方向深耕7年,先后参与了两代京东广告模型系统的架构建设。主导了大规模稀疏模型训练&推理等能力建设,助力多项算法创新落地,并多次获得京东零售级别奖项。目前作为广告算法架构方向架构师,带领团队建设新一代广告异构算法架构体系。

演讲题目:京东广告稀疏大模型训练与推理GPU优化实践

演讲提纲:从京东广告算法场景出发,介绍稀疏大模型训练&推理的GPU吞吐优化实践,具体包括:

1. 京东广告推荐场景介绍

2. 京东广告训练场景GPU优化实践

3. 京东广告推理场景GPU优化实践

听众收益:

1. 高并发、低延时场景如何高效利用GPU资源?

2. CPU与GPU异构资源场景如何分别最大化计算资源利用率?

3. 推荐领域大模型如何优化IO吞吐?


程孟力 阿里云 高级算法专家

个人介绍:主要负责图像OCR,推荐排序算法,多模态相关的模型研发和效率优化工作。

演讲题目:EasyRec 推荐算法训练推理优化

演讲提纲:

1. EasyRec 推荐算法框架

2. EasyRec 训练优化

3. EasyRec 推理优化

听众收益:

1. 了解推荐算法中常见的训练和推理优化技巧

2. 了解 EasyRec 算法框架的使用方法

3. 了解 EasyRecProcessor 的使用方法


陈玉祥 陌陌 算法工程专家

个人介绍:15年吉林大学计算机学院本科毕业,曾在去哪儿网,负责过机票事业部的机票搜索报价、售后服务系统研发。先后在陌陌,负责过推荐系统的推荐引擎研发和推荐模型训练与推理系统研发。目前是陌陌的机器学习平台负责人,希望打造高效的机器学习系统。

演讲题目:HugeCTR 在陌陌推荐系统的实践

演讲提纲:

1. 推荐系统在陌陌的应用

2. 推荐系统模型训练挑战

3. HugeCTR 与陌陌实践

4. 总结讨论 & OneMoreThing

听众收益:

1. 推荐系统模型特点

2. 高性能推荐系统模型训练方法


申晗 快手 AI编译器& 大模型推理异构 Tech Lead

个人介绍:申晗,清华本硕毕业,目前在快手担任 AI 平台编译器 & 大模型推理异构技术负责人,从0到1搭建推搜广的编译技术体系,负责推搜广模型在GPU上的训练性能优化,同时为快手大模型探索AI infra在英伟达之外的芯片可能性。过往职业经历: 快手之前经历过跨国公司Cisco 、自动驾驶独角兽地平线、早期GPU软件初创公司趋动科技,主要涉猎的技术方向包括框架性能优化(训练/推理/编译)、GPU性能优化、CV算法等。

演讲题目:快手推搜广的计算引擎优化实践

演讲提纲:本次分享将介绍快手AI平台过去在推搜广半精度训练、编译优化方面的技术探索,介绍内部基于OpenXLA的 KaiCompiler编译器,以及展望将来推搜在多元硬件上的可能性。

听众收益:

1. 如何在Tensorflow上做fp16、bf16的混合精度训练及在推荐业务落地成果

2. 编译优化在推搜广训练加速上的作用,有哪些落地场景

3. 快手AI业务在多元硬件的一些实践成果,有哪些难点

扫码免费报名,收看直播

相关推荐

  • 小红书图数据库在分布式并行查询上的探索
  • Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译,「不让任何语言掉队」
  • 代码都让AI写,CS还有前途吗?加州大学伯克利分校:CDSS申请人数飙升48%!
  • GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界
  • 50个案例带你学会AI视频制作
  • 每日AI资讯-20240616
  • 高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
  • AI将是数学家的得力助手,陶哲轩谈AI在证明过程中的潜力
  • 新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规则吗?
  • 星环科技孙元浩:语料已经是大模型最大的挑战
  • ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
  • 【深度学习】大规模DiT模型部署轻松拿下!港中文等提出TerDiT:性能不输全精度模型
  • 官宣!2024影响因子即将发布,将引入学科类别的统一排名,简化对期刊评估!
  • 三位青椒晒工作前几年的收入变化,有人买的房从4万涨到9万了
  • 文档表格结构识别技术与数据总结:兼看多模态表格理解基准设计及数据构建思路
  • Spring Cloud + Nacos + 负载均衡器实现全链路灰度发布实战
  • Java设计模式中策略模式,发短信消息案例
  • f-string,一个非常强大的Python字符串格式化工具
  • GitHub iOS 团队如何利用 Apple-Silicon Actions Runner 减少测试时间
  • Kong AI Gateway 正式 GA