手把手教你用LangChain实现大模型Agent

介绍如何构建LLM智能体系统。

长按关注《Python学研大本营》,加入读者群,分享更多精彩

关于智能体(Agents)

通常,大型语言模型(LLM)通常通过RAG(Retrieval-Augmented Generation)架构来增强其存储器能力。然而,LLM智能体(LLM Agents)不仅能增强存储器,还将推理、工具、答案和操作都集成到了其系统中。

LLMS是一种人工智能技术,可以生成类似人类语言的文本,而LLM智能体则是一种扩展了LLMS的系统,它可以执行更复杂的任务,例如搜索信息、使用工具和执行操作。

本文给大家介绍如何从头开始构建LLM智能体系统。

步骤1:规划

简单的“输入-输出”LLM使用方式与思维链、具有自洽性的思维链、思维树等技术之间的视觉差异。

LLM的性能得到不断的改进,有许多技术和方法用来提升。我们探讨以下技术:

  • 思维链(Chain of Thought):这是一种逐步思考的技术,模型被要求按步骤进行推理,从而实现自我纠正。这种方法有助于改善模型的输出质量。

  • 具有自洽性的思维链(Chain of Thought with Self-Consistency):这是对思维链的进一步发展,强调了模型在思考过程中保持一致性的重要性。模型在不同步骤之间保持一致,以提高输出的准确性。

  • 思维树(Tree of Thoughts):这是一种更广义的方法,其中多个思维被创建、重新评估并合并,以生成最终的输出。这种方法允许模型在不同路径上探索多个可能性,从而更全面地理解输入并生成更好的回复。

这些技术的应用有助于改善大型语言模型在各种自然语言处理任务上的性能,使其更加强大和灵活。

本文大量使用了Langsmith平台,该平台用于生产化LLM应用程序。例如,在构建思维树提示时,将子提示保存在提示存储库中,然后进行加载:

from langchain import hub
from langchain.chains import SequentialChain

cot_step1 = hub.pull("rachnogstyle/nlw_jan24_cot_step1")
cot_step2 = hub.pull("rachnogstyle/nlw_jan24_cot_step2")
cot_step3 = hub.pull("rachnogstyle/nlw_jan24_cot_step3")
cot_step4 = hub.pull("rachnogstyle/nlw_jan24_cot_step4")

model = "gpt-3.5-turbo"

chain1 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step1,
output_key="solutions"
)

chain2 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step2,
output_key="review"
)

chain3 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step3,
output_key="deepen_thought_process"
)

chain4 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step4,
output_key="ranked_solutions"
)

overall_chain = SequentialChain(
chains=[chain1, chain2, chain3, chain4],
input_variables=["input""perfect_factors"],
output_variables=["ranked_solutions"],
verbose=True
)

在这里想说明的是在像Langsmith这样的LLMOps系统中定义推理步骤和版本化它们的正确过程。此外,还可以在公共存储库查看其他流行推理技术的示例,如ReAct或带搜索功能的 Self-ask:

prompt = hub.pull("hwchase17/react")
prompt = hub.pull("hwchase17/self-ask-with-search")

其他值得注意的方法包括:

  • 反思(Reflexion):用于使Agents具有动态内存和自我反思能力,以提高推理技能。

  • 回顾链(Chain of Hindsight):鼓励模型查看过去的输出序列,以改善自身输出,从而更好地满足用户需求。

第2步:内存

我们可以将大脑中不同类型的记忆映射到LLM架构的各个组成部分上

  • 感官记忆:这个记忆组件捕捉了直接的感官输入,如我们所看到的、听到的或感觉到的。在提示工程和人工智能模型中,提示是一种短暂的输入,类似于瞬时触感,用于触发模型进行处理。它是初始的刺激,引导模型生成相应的输出。

  • 短期记忆:短期记忆暂时保存信息,通常与正在进行的任务或对话相关。在提示工程中,这相当于保留最近的聊天历史记录。这种记忆使Agents能够在互动过程中保持上下文和一致性,确保响应与当前对话相匹配。在代码中,通常将其添加为对话历史记录:

from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain.agents import AgentExecutor
from langchain.agents import create_openai_functions_agent

llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
tools = [retriever_tool]
agent = create_openai_functions_agent(
llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

message_history = ChatMessageHistory()
agent_with_chat_history = RunnableWithMessageHistory(
agent_executor,
lambda session_id: message_history,
input_messages_key="input",
history_messages_key="chat_history",
)
  • 长期记忆:长期记忆存储事实性知识和程序性指示。在人工智能模型中,这表现为用于训练和微调的数据。此外,长期记忆还支持RAG框架的操作,使Agents能够访问并将已学信息合并到其响应中。就像是Agents提供有关和相关输出的全面知识存储库一样。在代码中,通常将其添加为向量化数据库:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings

loader = WebBaseLoader("https://neurons-lab.com/")
docs = loader.load()
documents = RecursiveCharacterTextSplitter(
chunk_size=1000, chunk_overlap=200
).split_documents(docs)
vector = FAISS.from_documents(documents, OpenAIEmbeddings())
retriever = vector.as_retriever()

步骤3:工具

在实际操作中,希望通过单独的推理链来增强Agents(可以是另一种 LLM,即特定领域或另一种用于图像分类的 ML 模型),或者使用基于规则或API的方法来增强Agents。

ChatGPT Plugins 和 OpenAI API 函数调用就是利用工具使用能力增强 LLM 在实践中发挥作用的良好范例。

  • 内置Langchain工具:Langchain内置了一系列工具,从互联网搜索和Arxiv工具包到Zapier和雅虎财经。本文使用Tavily提供的互联网搜索:
from langchain.utilities.tavily_search import TavilySearchAPIWrapper
from langchain.tools.tavily_search import TavilySearchResults

search = TavilySearchAPIWrapper()
tavily_tool = TavilySearchResults(api_wrapper=search)

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)
agent_chain = initialize_agent(
[retriever_tool, tavily_tool],
llm,
agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
)
  • 自定义工具:定义自己的工具也非常简单。以计算字符串长度的工具为例进行分析。需要使用@tooldecorator让Langchain知道这个工具。然后,不要忘记输入和输出的类型。但最重要的部分是函数注释之间的""" """ ——这就是Agents如何知道这个工具是做什么的,并将此描述与其他工具的描述进行比较:
from langchain.pydantic_v1 import BaseModel, Field
from langchain.tools import BaseTool, StructuredTool, tool

@tool
def calculate_length_tool(a: str) -> int:
"""The function calculates the length of the input string."""
return len(a)

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)
agent_chain = initialize_agent(
[retriever_tool, tavily_tool, calculate_length_tool],
llm,
agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
)

你可能会看到一个错误——它没有正确提取Neurons Lab公司的描述,尽管调用了正确的自定义长度计算函数,最终结果却是错误的。可以试着进行修复。

步骤4:整合在一起

可以将所有架构部件组合在一起成为简洁版本。注意,可以很容易地分解并单独定义:

  • 所有类型的工具(搜索、自定义工具等)
  • 所有类型的记忆(感知作为提示,短期作为可运行消息历史记录,并在提示中作为素描板,以及长期作为从向量数据库检索)
  • 任何类型的规划策略(作为从LLMOps系统拉取的提示的一部分)

最终的Agents定义会像这样简单:

llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
agent = create_openai_functions_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
agent_with_chat_history = RunnableWithMessageHistory(
agent_executor,
lambda session_id: message_history,
input_messages_key="input",
history_messages_key="chat_history",
)

我们定义了一个完整的架构,其中短期记忆起着至关重要的作用。Agents获得了消息历史记录和一个作为推理结构的素描板,使其能够拉取正确的网站描述并计算其长度。

结束语

希望本文关于LLM Agents架构的核心元素的讲解对读者有所帮助。这里再次强调LLM Agents中所有元素的重要性。比如缺少短期记忆或者工具的描述不完整会影响LLM Agents的推理并提供错误的答案,即使是对于简单任务也是如此。

推荐书单

《PyTorch深度学习简明实战》

本书针对深度学习及开源框架——PyTorch,采用简明的语言进行知识的讲解,注重实战。全书分为4篇,共19章。深度学习基础篇(第1章~第6章)包括PyTorch简介与安装、机器学习基础与线性回归、张量与数据类型、分类问题与多层感知器、多层感知器模型与模型训练、梯度下降法、反向传播算法与内置优化器。计算机视觉篇(第7章~第14章)包括计算机视觉与卷积神经网络、卷积入门实例、图像读取与模型保存、多分类问题与卷积模型的优化、迁移学习与数据增强、经典网络模型与特征提取、图像定位基础、图像语义分割。自然语言处理和序列篇(第15章~第17章)包括文本分类与词嵌入、循环神经网络与一维卷积神经网络、序列预测实例。生成对抗网络和目标检测篇(第18章~第19章)包括生成对抗网络、目标检测。

本书适合人工智能行业的软件工程师、对人工智能感兴趣的学生学习,同时也可作为深度学习的培训教程。

【半价促销中】购买链接:https://item.jd.com/13512395.html

精彩回顾

30个数据工程中最常用的Python库(下)

30个数据工程中最常用的Python库(上)

SQL中常用的排序算法

10个高级的SQL查询方法

提升SQL数据安全,这3个方面要特别留意

仅需20行代码,掌握轻量型数据库SQLite3

只需5分钟,利用Python掌握SQLite3

长按关注《Python学研大本营》,加入读者群,分享更多精彩长按访问【IT今日热榜】,发现每日技术热点

相关推荐

  • 今日代码 PK | Java 使用正则表达式
  • 用了这个浏览器超级助手,效率提高 10 倍!
  • 我被刷几万元的血泪经验。。。
  • 何恺明和刘壮新作:消除数据集偏差的十年之战
  • 微软正式开源专为Windows打造的sudo
  • 有FA开始前置收费了,最高60w
  • 澜舟坚持四两拨千斤:ToB场景落地,10B参数大模型足矣
  • 骁龙最强AI芯能力下放:小旗舰8s发布,端侧运行10B大模型,小米Civi首发
  • Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩
  • 英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
  • “宝藏AI神器”通义听悟上新:超长音视频随便问,高校师生可获500小时免费时长
  • 百万token上下文窗口也杀不死向量数据库?CPU笑了
  • 从简单中窥见高端,彻底搞懂任务可中断机制与任务插队机制
  • 年初面试,真的不难……
  • 缓存没预热,翻车了!
  • 来挖转转漏洞啦!
  • 老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代
  • 建议!千万不要再无脑背八股文了!
  • 恭喜了!全体程序员彻底狂欢吧!这个好消息来得太及时!
  • 马斯克兑现承诺,Grok模型携3140亿参数强势开源,商业用途全免费!