实现了基于K-Means算法的聚类分析。首先，将数据进行z-score标准化，将数据转换为均值为0，标准差为1的标准正态分布。然后，设定聚类个数k为3，并使用K-Means算法对数据进行聚类。聚类结果以散点图的形式展示，其中每个样本点的颜色代表其所属的聚类簇。同时，将每个聚类簇的中心点以灰色的散点图形式展示出来。在输出各个类别的项目数时，通过sum函数和逻辑运算符==计算出每个聚类簇中样本点的数量。给出实验步骤

时间: 2024-01-21 10:19:41 浏览: 145

实验步骤如下： 1. 加载数据集并进行z-score标准化处理。 2. 设定聚类个数k为3，使用K-Means算法对数据进行聚类。 3. 绘制散点图展示聚类结果，其中每个样本点的颜色代表其所属的聚类簇。 4. 绘制灰色散点图展示每个聚类簇的中心点。 5. 输出各个类别的项目数，通过sum函数和逻辑运算符==计算出每个聚类簇中样本点的数量。具体实现代码如下： ```python import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt # 加载数据集并进行z-score标准化处理 data = pd.read_csv('data.csv') data = (data - data.mean()) / data.std() # 设定聚类个数k为3，使用K-Means算法对数据进行聚类 k = 3 kmeans = KMeans(n_clusters=k, random_state=0).fit(data) # 绘制散点图展示聚类结果 plt.scatter(data.iloc[:,0], data.iloc[:,1], c=kmeans.labels_) plt.title('K-Means Clustering Results') plt.xlabel('Feature 1') plt.ylabel('Feature 2') # 绘制灰色散点图展示每个聚类簇的中心点 centers = kmeans.cluster_centers_ plt.scatter(centers[:,0], centers[:,1], c='gray', s=200, alpha=0.5) # 输出各个类别的项目数 for i in range(k): count = np.sum(kmeans.labels_ == i) print(f'Cluster {i+1} has {count} items.') plt.show() ``` 运行该代码，即可得到聚类结果、聚类中心和各个类别的项目数。

阅读全文

相关推荐

k-means_K-Means算法实现_K._聚类可视化_数据可视化、_

聚类算法K-means实现

K-Means算法实现聚类分析&实现人工神经网络 实验报告+代码

聚类-基于Multi-GPU实现K-Means聚类算法-附项目源码-优质项目实战.zip

k-means-python3-:聚类算法k-means的简单实现

Python实现K-Means聚类算法在评论数据分析中的应用

基于K-means算法的时间序列数据聚类实践

k-means聚类算法.docx

K-Means聚类分析广告投放效果的改进（数据标准化、最佳K值的确定）

kmeans-data-mining:用于评论的 k-means 聚类算法的 Python 实现

K-means聚类实验_K._sleep9oo_简单的多类类K均值聚类_

数据分析实战 - K-means算法-蛋白质消费特征分析

Matlab K均值聚类分析作业.zip_K._k均值聚类_k均值聚类matlab_k均值聚类作业_均值聚类

聚类分析基础：K-means算法完全指南与实战演练

K-means聚类分析：汽车市场细分与定位

【进阶篇】利用Scikit-learn的聚类算法（如K均值、层次聚类）进行无监督学习和数据分组。

【聚类分析核心】：K-Means与层次聚类实战指南

数据归一化与K-Means聚类：深入理解归一化的必要性

【SSE指标评估】：使用SSE指标评估K-means聚类算法效率与稳定性

最新推荐

MATLAB实现小波阈值去噪：Visushrink硬软算法对比

管理建模和仿真的文件

【交互特征的影响】：分类问题中的深入探讨，如何正确应用交互特征

c语言从链式队列 中获取头部元素并返回其状态的函数怎么写

易语言实现画板图像缩放功能教程

"互动学习：行动中的多样性与论文攻读经历"

【交互特征：优化与调试的艺术】：实战技巧，提升回归模型与分类模型的性能

用IDEA写一个高速收费系统框架附带代码

大模型推荐系统: 优化算法与模型压缩技术

关系数据表示学习

K-Means算法实现聚类分析&实现人工神经网络实验报告+代码

c语言从链式队列中获取头部元素并返回其状态的函数怎么写