都说 RAG “烂大街”了,但为何深度应用寥寥无几?| 直播预告

大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中,RAG 技术将传统信息检索技术与大语言模型技术相结合,为知识理解、知识获取提供了全新的解决方案。然而,尽管 RAG 在很多任务上表现出色,其在深度应用上仍面临诸多挑战。

比如:

  • 检索的准确性和低幻觉,如何适配不同的场景和行业,极大幅度提高准确性以及降低幻觉率。

  • 解答复杂问题,如何智能化从各种异构数据源中获取信息,来有效解答复杂问题。

  • 技术集成的复杂度,需要同时精通检索系统和大语言模型技术,实际应用中有顺畅的体验(这是性能问题),而且用得起(这是成本问题)。

  • ……

鉴于此,我们策划了这场以 RAG 技术为主题的圆桌讨论活动,旨在探讨 RAG 技术的当前进展、面临的挑战、未来的发展方向以及在不同行业中的应用潜力。

直播时间

7 月 10 日 20:00-21:30

直播主题

都说 RAG “烂大街”了,但为何深度应用寥寥无几?

嘉宾信息

主持人:郭瑞杰 阿里巴巴总监 & TGO 鲲鹏会学员

嘉宾欧明栋 阿里云 / 高级算法专家、张颖峰 英飞流 /CEO、常扬 合合信息 / 研发总监

直播亮点
  • RAG 技术在不同行业中的应用差异、挑战及潜在影响

  • RAG 技术真的“烂大街”了?对 RAG 技术的深入理解

  • 基于 Agent 的高级 RAG,针对复杂问题的解法

  • RAG 技术未来的发展预测与畅想

如何看直播?

扫描下图海报【二维码】,或戳直播预约按钮,预约 InfoQ 视频号直播。👇

更多精彩内容,欢迎持续关注 8 月 18-19 日的 AICon 上海站,届时,几位老师将带来如下分享:

讲师:欧明栋 阿里云高级算法专家

演讲主题:阿里云 AI 搜索 RAG 大模型优化实践

RAG(检索增强生成)是大模型应用的重要方向,它大幅缓解了大模型幻觉、信息更新不及时、专业域或私有域知识匮乏等问题,显著提升了大模型在知识库问答、网页搜索、客服等领域的可信赖度。但我们发现,在实际落地中,RAG 仍存在不少问题,如:文档解析结构丢失、大模型生成幻觉、复杂问题无法解答等等,本次演讲我将主要分享以上问题的解决方案,希望能给大家带来一些启发和思考。

演讲提纲

  1. RAG 技术背景及应用场景介绍;

  2. 文档结构化:基于大模型的文档层次结构提取;

  3. RAG 场景生成幻觉优化:面向 RAG 的大模型微调;

  4. RAG Agent 探索:基于 Agent 的自适应 RAG;

  5. RAG 案例解析;

  6. 总结与展望。

听众收益

  1. 阿里云 AI 搜索 RAG 在实际应用场景中碰到的问题及尝试的解决方案

  2. 阿里云 AI 搜索 RAG 大模型优化实践中的失败和成功经验

讲师:王元 IET / 皇家特许工程师

演讲主题:从 RAG 到微调:企业知识问答大模型演进之路

越来越多的企业利用大模型构建专属领域的知识问答型机器人。通过使用 RAG 和提示工程技术,企业可以快速基于预训练大模型构建功能和产品,但随着业务量和场景的增加,其性能受到多种因素制约,比如大模型调用成本、多场景支持、法务合规等。本次演讲将介绍我们通过大模型微调,完成 GPT-3.5 / 开源模型完全替换 GPT-4 的实践和经验,并展望未来发展方向。

演讲提纲  

  1. 系统架构的演进

  2. RAG 系统的问题

  3. 子模块的指标设计

  4. 数据问题及解决方案

  5. 微调技术实践

  6. 微调后调优与测试

  7. 总结与展望

听众收益

  1. 了解 RAG 和微调的异同与适用场景

  2. 了解大模型微调的技术难点和实践经验

  3. 了解微调的副作用以及微调后调优策略

讲师:常扬 合合信息 / 研发总监

演讲主题:向量化与文档解析技术加速大模型 RAG 应用落地

大模型落地应用中,RAG(Retrieval-Augmented Generation)与大模型文档相关 Agent 在落地时常遇到文档无法正确解析、表格公式目录等文档元素解析丢失、知识库文档解析速度慢、机械分 chunk 丢失语义信息、目标内容召回不到等问题,极大影响了 RAG 落地应用效果与用户体验。

本次演讲从 RAG 应用落地时常见问题与需求(文档解析、检索精度)出发,介绍针对性的高精度、高泛化性、多版面多元素识别支持的文档解析技术方案与整合长文档解析引擎、层级切片技术的向量化 Embedding 模型技术方案,最后分享开放域多模态信息抽取应用与知识库问答应用等实际场景的产品实践案例。

演讲提纲

  1. RAG 落地时的常见的问题与需求

  2. 文档解析技术 + 向量化技术的研究内容

  3. 文档解析技术方案介绍

  4. 向量化 Embedding 模型技术介绍

  5. 实际场景产品实践案例

听众收益

  1. 深入了解 RAG 应用落地的挑战与解决方案

  2. 掌握文档解析与向量化 Embedding 模型技术逻辑与原理

  3. 通过 RAG 应用落地的案例分享,获得实践经验

讲师:张颖峰 英飞流 /CEO

演讲主题:从 RAG 1.0 走向 RAG 2.0 ——技术挑战与实现

RAG 1.0 是以 LLMOps 为核心的 RAG 编排系统,通过把各种组件如 Embedding 模型,向量数据库等编排在一起,快速让用户搭建起原型。然而在面向企业级场景使用的时候,常常会面临各种问题却无法应对。RAG 2.0 是以搜索为核心的端到端系统,它将整个 RAG 按照搜索的典型流程划分为若干阶段:包含数据的信息抽取、文档预处理、构建索引、以及检索,并且每个环节都围绕一系列模型协同工作。本次分享主要带来 InfiniFlow 在这些环节的具体进展,并介绍如何打造标准化的企业级 RAG 2.0 产品。

演讲提纲

  1. RAG 1.0 的痛点

  2. 以搜索为中心的 RAG 2.0

    1. 数据抽取模型——实现与演进

    2. 文档预处理模型

      • 知识图谱

      • 聚类

      • Embedding 的选择与微调

    3. 召回和排序

      • 全文搜索

      • Blended RAG 三路召回

      • Tensor 召回与 Cross Encoder

    4. Agent 与 Agentic RAG

  3. RAG 的未来发展

听众收益  

  1. 如何解决 RAG 落地场景的技术挑战

  2. 如何实现企业级 RAG 和 Agent

会议推荐

AICon 全球人工智能开发与应用大会,为资深工程师、产品经理、数据分析师等专业人群搭建深度交流平台。汇聚 AI 和大模型超全落地场景与最佳实践,期望帮助与会者在大模型时代把握先机,实现技术与业务的双重飞跃。在主题演讲环节,我们已经邀请到了「蔚来创始人 李斌」,分享基于蔚来汽车 10 年来创新创业过程中的思考和实践,聚焦 SmartEV 和 AI 结合的关键问题和解决之道。大会火热报名中,7 月 31 日前可以享受 9 折优惠,单张门票节省 480 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。

相关推荐

  • 《中国开发者画像洞察研究报告 2024》报告发布:鸿蒙生态存在百万级人才缺口,潜在新就业岗位超过300万个
  • “我的代码被微软和 OpenAI 抄了,维权后被他们耗了两年”
  • LeCun新作:神经网络在实践中的灵活性到底有多大?
  • 语义熵识破LLM幻觉!牛津大学新研究登Nature
  • 全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业
  • 全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?
  • OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝
  • ACL 2024 | OceanGPT(沧渊):面向海洋科学任务的大型语言模型初探
  • 什么是大模型所需要的知识?人大提出DPA-RAG高效对齐检索器与大模型偏好
  • 快速“水”论文必备:82个即插即用涨点模块!
  • 海外LLM高质量数据集免费送
  • AI时代:企业如何抓住人工智能的黄金机遇?
  • Apache SeaTunnel——OLAP 引擎的数据动脉
  • 数据中心疯狂扩张!谷歌的温室气体排放量在五年内激增48%
  • WOT全球技术创新大会2024优秀出品人&优秀讲师评选揭晓
  • 史上最大规模的被盗密码库流入黑市!近100亿凭证信息让撞库攻击风险飙升
  • 深度解析RAG大模型知识冲突,清华西湖大学港中文联合发布
  • 人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
  • 单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE
  • WAIC观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出