当前位置：首页 > news >正文

三、使用langchain搭建RAG:金融问答机器人--检索增强生成

news 2025/4/5 12:04:07

经过前面2节数据准备后，现在来构建检索

加载向量数据库

from langchain.vectorstores import Chroma
from langchain_huggingface import HuggingFaceEmbeddings
import os# 定义 Embeddings
embeddings = HuggingFaceEmbeddings(model_name="m3e-base")# 向量数据库持久化路径
persist_directory = 'data_base/chroma'# 加载数据库
vectordb = Chroma(persist_directory=persist_directory, embedding_function=embeddings
)

定义提示词模板

要求模型使用上下文来回答问题，这个上下文就是context，也就是从向量数据检索到相关的文本片段后，回答最后的问题question

from langchain.prompts import PromptTemplate# 我们所构造的 Prompt 模板
template = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答案。尽量使答案简明扼要。”。
{context}
问题: {question}
有用的回答:"""# 调用 LangChain 的方法来实例化一个 Template 对象，该对象包含了 context 和 question 两个变量，在实际调用时，这两个变量会被检索到的文档片段和用户提问填充
QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],template=template)

定义大模型LLM

需要先到阿里通义千问申请账户，具体操作指引在这里

import os
os.environ["DASHSCOPE_API_KEY"] = 'sk-******'
from langchain_community.llms import Tongyi
llm = Tongyi()

定义检索问答链

from langchain.chains import RetrievalQA
qa_chain = RetrievalQA.from_chain_type(llm,retriever=vectordb.as_retriever(),return_source_documents=True,chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})

对比大模型和检索生成的结果

大模型：

question = "上海华铭智能终端设备股份有限公司的股东有哪些人？"
# 仅 LLM 回答效果
result = llm(question)
print("大模型回答 question 的结果：")
print(result)

在这里插入图片描述
检索：

result = qa_chain({"query": question})
print("检索问答链回答 question 的结果：")
print(result["result"])

在这里插入图片描述
检索详情：

print(result)

在这里插入图片描述

查看全文

原文地址:https://blog.csdn.net/ai_lian_shuo/article/details/144560487
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mrgr.cn/news/80675.html 如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！