当前位置: 首页 > news >正文

21-Terms 不正确的案例

如何解决 Terms 不准的问题:提升 shard_size 的参数

Terms 聚合分析不准的原因,数据分散在多个分⽚上, Coordinating Node ⽆法获取数据全貌

  • ⽅案 1:当数据量不⼤时,设置 Primary Shard 为 1;实现准确性
  • ⽅案 2:在分布式数据上,设置 shard_size 参数,提⾼精确度
    • 原理:每次从 Shard 上额外多获取数据,提升准 确率

shard_size 设定

● 调整 shard size ⼤⼩,降低 doc_count_error_upper_bound 来提升准确度

  • 增加整体计算量,提⾼了准确度,但会降低相应时间

● Shard Size 默认⼤⼩设定

  • shard size = size *1.5 +10
  • Terms Aggregation | Elasticsearch Guide [7.1] | Elastic

打开show_term_doc_count_error

  • Show Term Doc Count Error: true,显示术语文档计数错误。
GET my_flights/_search
{"size": 0,"aggs": {"weather": {"terms": {"field":"OriginWeather","size":1,"shard_size":1,"show_term_doc_count_error":true}}}
}

http://www.mrgr.cn/news/67918.html

相关文章:

  • 鸿蒙开发案例:水平仪
  • (十四)JavaWeb后端开发——MyBatis
  • class com.alibaba.fastjson2.JSONObject cannot be cast to class com.ruoyi.sys
  • vue实战学习(1)(Vue概述、Vue学习方向)
  • Uniapp全局文件执行顺序详解
  • [ 内网渗透实战篇-1 ] 单域环境搭建与安装域环境判断域控定位CS插件装载CS上线
  • 创新实践:基于边缘智能+扣子的智慧婴儿监控解决方案
  • 面向对象设计OOD
  • Android 解决Java和Kotlin JDK编译版本不一致异常
  • Jest项目实战(6):搭建文档网站
  • Java 抽象类 详解
  • Javascript常见数据结构及其应用场景
  • 【Chapter 2_ Sentosa_DSML Community Edition Product Features】
  • FPGA实战篇:Moore/Mealy状态机
  • 找不到msvcp140.dll怎么办,总结六种解决msvcp140.dll丢失的方法
  • Linux系统-rocky系统安装
  • 《现代网络技术》读书笔记:SDN数据平面和OpenFlow
  • DeFi 4.0峥嵘初现:主权金融时代的来临
  • 《Vue3 报错》Uncaught TypeError: s.finally is not a function
  • Jest项目实战(3):打造完善的开源项目准备指南
  • 面相小白的php反序列化漏洞原理剖析
  • 大模型微调技术 --> LoRA 系列之 LoRA(现今最火热的模型微调方法,甚至没有之一,下面有常用的 lora 参数)
  • ERROR command “uni-serve$1$1“ does not exist.
  • 2024年11月7日练习(滑动窗口算法)
  • Elasticsearch和Lucene之间是什么关系?(ChatGPT回答)
  • 群晖NAS轻松实现文件云同步的解决方案——Cloud Sync!