当前位置: 首页 > news >正文

修正Z-score检验异常值

传统 Z-score
计算公式:z = (x - mean) / std

异常值阈值:

  • 阈值 = 2:如果使用Z-score的绝对值大于2作为异常值的判定标准,那么大约有95%的数据将位于这个阈值内,这意味着只有大约5%的数据可能被视为异常值
  • 阈值 = 3:如果使用Z-score的绝对值大于3作为异常值的判定标准,那么大约有99.7%的数据将位于这个阈值内,这意味着只有大约0.3%的数据可能被视为异常值

Z-score主要衡量均值差异,要求数据符合正太分布,且容易收到异常值影响。

修正Z-score

median = np.median(x)
mad = np.median(np.abs(x - median))
z_mad = 0.6745 * (x - median) / mad  # 0.6745是常数,与数据的分布有关

异常阈值设置:对于较大的数据集,阈值通常设置为3,较小数据集可以修正为2

修正Z-score优势
‒ 使用MAD(中位数绝对偏差)而不是标准差,这样对异常值更稳健;传统Z-score由于计算样本标准差,容易收到异常数值影响。
‒ 适合非正态分布的数据。


http://www.mrgr.cn/news/66240.html

相关文章:

  • 怎样用示波器显示出爱心波形?
  • RabbitMQ交换机类型
  • ComfyUI和Photoshop相结合,PS内实现:文生图,图生图,高清放大,局部重绘,面部修复,设计师福音
  • python中应该使用while 1吗?按位运算符可以代替逻辑运算符使用吗?
  • 【已解决】群晖docker无法删除容器 “Error response from daemon: container” 终极解决办法
  • [ vulnhub靶机通关篇 ] 渗透测试综合靶场 Corrosion1 通关详解 (附靶机搭建教程)
  • React 前端如何通过组件完成 “下载 Excel模板” 和 “上传 Excel 文件并读取内容生成可使用的对象数组”
  • Linux(文件管理 图片+大白话)
  • 人工智能学习--归一化(Normalization)
  • 动态规划-两个数组的dp问题——44.通配符匹配
  • 雷池社区版新版本功能防绕过人机验证解析
  • 如何无缝更换WordPress主题:关键步骤详解
  • 智慧工地:引领工地管理和监测的革新
  • 有代码MoSE: Modality Split and Ensemble forMultimodal Knowledge Graph Completion
  • lc 153 寻找旋转排序数组的最小值
  • keep-alive - 2024最新版前端秋招面试短期突击面试题【100道】
  • 【Ant.designpro】上传图片
  • 测试流程是什么?
  • ins账号多开被封?指纹浏览器来解决!
  • 全栈电子硬件工程师是怎样炼成的?
  • 苹果企业签名掉签有哪些原因
  • gitmakegdb
  • 生物医药产业前景如何?怎样开展生物医药产业分析?
  • 经纬恒润车载TSN网络测试仪TestBase-ATT全新上线!
  • 数组和字符串的es6新方法使用和综合案例
  • 数字身份发展趋势前瞻:身份韧性与安全