当前位置: 首页 > news >正文

从零实现本地大模型RAG部署

1. RAG概念

RAG(Retrieval-Augmented Generation)即检索增强生成,是一种结合信息检索与大型语言模型(大模型)的技术。从外部知识库(如文档、数据库或网页)中实时检索相关信息,并将其作为输入提供给 大模型,从而增强模型生成答案的能力,具体是指在大模型生成回答之前,先从知识库中查找相关的知识内容,增强信息生成过程中的知识库中的内容,从而提升生成的质量和准确性,这一过程分为三个阶段:

检索:使用向量数据库和近似最近邻(ANN)算法快速定位与查询相关的文本片段。
融合:将检索到的信息处理后与原始查询结合,形成扩展的上下文。
生成:大模型 基于融合后的上下文生成最终答案,减少“幻觉”现象。

2. RAGFlow 部署

RAGFlow是一个基于深度文档理解的开源RAG引擎。它为任何规模的企业提供了一个简化的RAG工作流程,结合LLM(大型语言模型)提供真实的问答功能,并得到各种复杂格式数据的充分引用。

2.1 源码加载

# 网盘地址: https://pan.baidu.com/s/1m0nUnq5po4zpnIWPvU_obw?pwd=zhen
git clone git@github.com:infiniflow/ragflow.git

在这里插入图片描述

2.2 修改配置版本

$ cd ragflow/docker
# 修改配置文件安装v0.17.2,默认是v0.17.2-slim
nano .env
RAGFlow 镜像标签镜像大小 (GB)具备嵌入模型是否稳定版
v0.17.2≈9✔️
v0.17.2-slim≈2
nightly≈9✔️
nightly-slim≈2

在这里插入图片描述

2.3 docker执行安装

cd 
# 仅使用CPU 执行任务:
# docker compose -f docker-compose.yml up -d
# 使用 GPU 加速:
docker compose -f docker-compose-gpu.yml up -d

在这里插入图片描述
在这里插入图片描述

3. 运行效果

http://localhost:80

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述


http://www.mrgr.cn/news/97334.html

相关文章:

  • 小刚说C语言刷题——第16讲 switch语句
  • 【Linux学习笔记】初识进程概念和进程PCB
  • 构建企业级表单验证系统:可配置化验证器设计与实现
  • C语言中单向链表:创建节点与插入新节点
  • btrfs , ext4 , jfs , xfs , zfs 对比 笔记250406
  • 基于BP神经网络的杂草智能识别系统(杂草识别、Python项目)
  • pulsar中的延迟队列使用详解
  • 消息队列基础概念及选型,常见解决方案包括消息可靠性、消息有序、消息堆积、重复消费、事务消息
  • 整车CAN网络和CANoe
  • C# Winform 入门(12)之制作简单的倒计时
  • WEB安全--内网渗透--LMNTLM基础
  • 计算机系统--- BIOS(基本输入输出系统)
  • JCR一区文章,壮丽细尾鹩莺算法Superb Fairy-wren Optimization-附Matlab免费代码
  • iOS APP集成Python解释器
  • 设计模式简述(十三)适配器模式
  • 高频面试题(含笔试高频算法整理)基本总结回顾65
  • Spring 中的 @Autowired 和 @Resource
  • 美国mlb与韩国mlb的关系·棒球9号位
  • 计算机系统---UEFI(统一可扩展固件接口)
  • 开源软件与自由软件:一场理念与实践的交锋