当前位置：首页 > news >正文

【大模型之Graph RAG系列之一】由谷歌搜索的演进看知识图谱如何改进RAG技术

news 2025/4/3 14:24:34

引言

在大模型时代把知识库和大模型技术相结合的 RAG 技术因为提高搜索和问答的准确性和洞见,帮助企业更好地理解客户需求,提供更个性化和满足客户需求的服务。

传统的基于向量的RAG（Retrieval Augmented Generation）技术在面对海量数据时，常常面临着与互联网早期AltaVista现象相似的问题，即搜索结果准确性低，用户难以快速找到所需信息。本文旨在探讨一种新的基于知识图谱的RAG技术，它被认为是提升智能搜索准确度的关键方向之一。

作为介绍Graph RAG技术的系列文章之一，本文将首先回顾“AltaVista效应”及其解决方案，进而揭示Graph RAG技术在现代搜索中的应用潜力。

在这里插入图片描述

1. “AltaVista效应”及谷歌的解决方案

在互联网的早期，用户在进行搜索时常常会遇到一个问题，即“AltaVista效应”。这个效应指的是用户在搜索结果中收到成千上万的网页，其中许多都是不相关的，这使得用户难以找到真正需要的信息。在那个时代，由于互联网内容有限，这个问题并不明显。然而，随着内容的爆炸性增长，这个问题变得越来越严重。

在这里插入图片描述

谷歌为了解决“AltaVista效应”，推出了PageRank技术。PageRank是一种图形算法，它通过分析网页之间的链接关系，对网页的重要性进行排名。这种方法侧重于关键词匹配和链接分析，将信息视为字符串的集合。PageRank技术的出现，极大地提高了搜索结果的相关性，使得用户能够更快地找到所需信息。

2. PageRank到知识图谱的演进

尽管PageRank技术在很大程度上解决了“AltaVista效应”，但它仍然存在一定的局限性。PageRank主要依赖于文本和链接分析，往往难以理解字符串背后的含义以及它们之间的关系。为了进一步提高搜索质量，谷歌在2012年推出了知识图谱。

知识图谱将信息表示为概念、实体和关系的网络，使得谷歌能够理解搜索查询的含义和上下文。例如，搜索“Moscone Center”时，不仅会返回包含这些关键词的网页，还会展示一个包含地址、所有者等结构化信息的面板。这一创新使得谷歌搜索结果更加准确、全面和富有信息性。
知识图谱的出现，标志着谷歌搜索从“PageRank时代”向“知识图谱时代”的演进。这一转变不仅提高了搜索质量，还使得谷歌能够直接回答用户的问题，而不仅仅是提供链接列表。
在这里插入图片描述