智谱、月之暗面、阿里、字节、vivo、达观数据等专家深入剖析 RAG 技术及其应用,AICon 邀你共鉴前沿

在 AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 的盛会上,我们特别策划了“RAG 检索与生成落地实践专题论坛”。

该论坛旨在深入探索 Retrieval-Augmented Generation (RAG) 技术如何有效解决大语言模型在幻觉问题、知识更新等方面的挑战。RAG 技术作为学术界和工业界的热点,其在实际应用中遇到的挑战及应对策略将是本次论坛的核心议题。我们将探讨构建高效 RAG 系统的各个方面,包括信息处理与检索的优化策略、生成模型训练与微调的效果提升,以及降低 RAG 应用实施成本的方法。

本次论坛荣幸邀请到了蚂蚁阿里巴巴总监郭瑞杰作为出品人。郭老师在搜索和大模型 RAG 应用平台建设领域拥有丰富的经验,是阿里巴巴搜推广工程体系 AI.OS 的早期开拓者,并负责多代搜索引擎的架构设计与开发工作。他目前负责阿里巴巴集团搜索中台业务、阿里云搜索产品线,及搜索引擎 Havenask(HA3)的开源项目,创建了多个云产品,包括 OpenSearch LLM 智能问答 (RAG)、阿里云 Elasticsearch、智能推荐 AlRec 和图计算等。

在这一精彩的专题论坛中,我们将迎来六位杰出的演讲嘉宾:

首位嘉宾是柴思远,智谱商业技术中心的负责人。作为一个深谙大数据算法技术的专家,柴思远成功组建了智谱的解决方案团队,支持了包括美团、360、金山、小米等在内的多个行业巨头的大模型项目。他将分享“智谱 RAG 技术的探索与实践”,讲解 RAG 技术的基本原理、智谱 GLM RAG 技术的应用场景、面临的挑战,以及智谱大模型 RAG 技术的效果策略。

接下来,vivo 互联网产品平台架构团队负责人张硕将介绍“vivo 一站式 AI 智能体构建平台演进实践”。张硕将探讨 vivo 蓝心九问平台的背景、面临的场景挑战和核心技术方案,展示如何通过自研 RAG 技术和 Agent 智能体实践方案满足各业务定制化的 AI 智能体需求。

邢少敏,阿里巴巴 OpenSearch 研发负责人,将带来“OpenSearch RAG 应用实践”的分享。他将以阿里巴巴的搜索产品 OpenSearch 为例,深入探讨 RAG 技术如何在搜索服务中实现一站式对话式搜索服务,分享知识问答场景下的实践经验及开发者平台的构建。

许文敏,字节跳动数据平台部前端负责人,将介绍“LLM 在字节跳动 A/B 实验平台的应用探索”。她将详细讨论通过 LLM 方案设计提升实验报告分析效率和降低实验创建门槛的方法,分享 LLM 与 RAG 技术结合的策略,以及这些技术在字节跳动内部业务和面向 ToB 企业应用场景中的落地实践。

王文广,达观数据创新产品部副总裁,将探讨“知识图谱在曹植大模型可控性方面的探索实践”。他将从大模型的幻觉和知识更新问题出发,详细阐述如何利用知识图谱技术提高大模型的可解释性、可操作性和可控性。通过王文广的演讲,听众将深入理解大模型可控性和知识更新的挑战,以及知识图谱和 RAG 技术的结合应用。

最后,我们有幸邀请到唐飞虎,月之暗面公司的高级研发工程师及开发者关系负责人。在她的演讲“Long-Context vs RAG:谁将主导未来?”中,唐飞虎将分析 Long-Context 模型与 RAG 技术的发展历程、性能对比,并讨论在实际应用中找到二者之间最佳平衡点的方法。此外,她还将介绍 KV Cache 技术及如何在实践中综合使用两种技术优化产品性能。

本次“RAG 检索与生成落地实践专题论坛”旨在为参与者提供一个深入了解 RAG 技术及其应用的平台,通过六位行业专家的精彩分享,参与者将能够获得关于 RAG 技术在各个领域应用的最新进展、挑战及应对策略的全面认识。从智谱的 RAG 技术探索,到 vivo 智能体构建平台的演进,从 OpenSearch 的 RAG 应用实践,到字节跳动 A/B 实验平台的 LLM 应用探索,再到达观数据大模型可控性的研究,以及 Long-Context 与 RAG 的未来发展方向,本论坛将为 AI 和大模型的开发与应用提供宝贵的洞见和前瞻性指导。

通过精心策划的论坛安排和行业内领先专家的深入分享,我们期待与所有参与者一同探索 RAG 技术的无限可能,共同推动人工智能与大模型开发与应用领域的进步与创新。

活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 是由极客邦科技旗下 InfoQ 中国主办的技术盛会,主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,更多精彩话题可点击原文查看。

目前会议 8 折优惠购票,火热进行中,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。

相关推荐

  • QCon 大会偶遇大佬,聊聊 ZingJDK 和 JVM
  • “微软已经沦落为 OpenAI 的一个 IT 部门”!资源倾斜引发微软内部员工不满、高管离职
  • Java程序员必备咖啡杯
  • 程序员逆袭CEO总共分几步?
  • 微信全新Linux版本开放下载——基于原生跨平台方案重构
  • 没事别想不开去创业!
  • 大学教师磨洋工的十大惯用招数
  • GPT-4.5 疑似面世,OpenAI 官网网页被索引,最快明天发布?
  • Kimi Chat ——愿称之为国内最好用的AI办公助手!
  • GitHub顶流"Web OS"——运行于浏览器的桌面操作系统、用户超100万、原生jQuery和JS编写
  • LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
  • 4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
  • 智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
  • 零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
  • 能说会看会行动,OpenAI机器人,一出手就是王炸
  • 大模型RAG问答技术扫盲:RAG的基本认识、演变、关键技术、增强方案及潜在挑战
  • 20240313大模型进展早报:兼论大模型FAQ生成及RAG多轮问答
  • 深度学习训练过程可视化(附github源码)
  • 深度学习模型加速方法详解:以ERNIE工业化部署为例(速度提升7倍)
  • 大厂年终奖也太…只发了4.5个月,准备跑路了…