当前位置: 首页 > news >正文

2024最新分别利用sklearn和Numpy实现c均值对鸢尾花数据集进行聚类(附完整代码和注释)

C均值聚类算法(K-Means Clustering)是一种非常流行的聚类算法,用于将数据点分成多个簇,使得簇内的点尽可能相似,簇间的点尽可能不同。以下是K-Means算法的基本步骤:

1. 初始化:随机选择K个点作为初始的簇中心(质心)

2. 分配:将每个数据点分配到最近的质心所属的簇中。

3. 更新:计算每个簇中所有点的均值,更新质心为这个均值。

4. 迭代:重复步骤2和3,直到满足某个终止条件(例如,达到最大迭代次数,或者质心的变化小于某个阈值)。

5. 终止:当满足终止条件时,算法结束,最终的簇划分就是聚类结果。

sklearn方法

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.preprocessing import StandardScaler# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data# 数据标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)# 定义不同的K值
k_values = [2, 3, 4, 5]# 评估不同K值的聚类效果
for k in k_values:km

http://www.mrgr.cn/news/46873.html

相关文章:

  • Windows图形界面(GUI)-QT-C/C++ - Qt图形绘制详解
  • C#进阶-在Ubuntu上部署ASP.NET Core Web API应用
  • Java-数据结构-栈与队列(常考面试题与单调栈)
  • 解读若依微服务架构图:架构总览、核心模块解析、消息与任务处理、数据存储与缓存、监控与日志
  • 【Java】-- 利用 jar 命令将配置文件添加到 jar 中
  • 罗永浩再创业,这次盯上了 AI?
  • Linux平台Kafka高可用集群部署全攻略
  • C++学习笔记----8、掌握类与对象(六)---- 操作符重载(3)
  • 计算机视觉算法--原理、技术、应用、发展
  • 开源 AI 智能名片 O2O 商城小程序源码助力企业实现三层式个性化体验
  • 回溯算法之组合求解详细解读(附带Java代码解读)
  • TypeError Cannot read properties of undefined (reading ‘endsWith‘)
  • QDesktopWidget Class
  • 查询v$asm_disk等待enq: DD - contention
  • Python OpenCV精讲系列 - 实例分割深入理解(十八)
  • 【回顾原生JDBC手动管理事务以及两种方式实现Spring编程式事务】
  • STM32 -- USB CDC 虚拟串口通信
  • 【30天玩转python】最后复习与总结
  • 详解SSH和bash
  • [实时计算flink]维表JOIN语句
  • React内置Hook函数-UseEffect
  • xianshan分支预测单元基础与top层介绍
  • 离散数学概述
  • 运行shell脚本的两种方式
  • Python | Leetcode Python题解之第468题验证IP地址
  • ffmpeg面向对象——AVInputFormat与URLProtocol啥关系