大模型:索引构建、预检索与检索阶段、检索后与生成阶段
目录
索引构建、预检索与检索阶段、检索后与生成阶段
索引构建
预检索与检索阶段
检索后与生成阶段
拓展
索引构建拓展
预检索与检索阶段拓展
检索后与生成阶段拓展
关键信息
索引构建
预检索与检索阶段
检索后与生成阶段
索引构建、预检索与检索阶段、检索后与生成阶段
索引构建
- 文本分割:因自然文本长,需分割以适应模型输入限制,如 Bert 上限 512 token。关键是找信息完整性和检索性能平衡,策略有滑动窗口等方法(如句子窗口检索)及块组织结构优化(如自动合并检索法构建层次索引等)。