Kmeans算法读取多维csv数据集分类并且可视化

Kmeans算法是一种常用的聚类算法，它可以将数据集划分为若干个簇，每个簇中的数据点彼此相似，而不同簇中的数据点差异较大。下面是用Python实现Kmeans算法读取多维csv数据集分类并且可视化的步骤： 1. 导入需要的库 ```python import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt ``` 2. 读取csv数据集 ```python data=pd.read_csv('data.csv') ``` 3. 数据预处理 ```python #将数据集中的特征数据提取出来，存储在X中 X=data.iloc[:,[0,1,2,3]].values ``` 4. Kmeans聚类 ```python #设置簇的个数为3 kmeans=KMeans(n_clusters=3) #训练模型 y_kmeans=kmeans.fit_predict(X) ``` 5. 可视化结果 ```python #可视化结果，用不同的颜色标记不同的簇 plt.scatter(X[y_kmeans==0,0],X[y_kmeans==0,1],s=100,c='red',label='Cluster1') plt.scatter(X[y_kmeans==1,0],X[y_kmeans==1,1],s=100,c='blue',label='Cluster2') plt.scatter(X[y_kmeans==2,0],X[y_kmeans==2,1],s=100,c='green',label='Cluster3') #标记聚类中心 plt.scatter(kmeans.cluster_centers_[:,0],kmeans.cluster_centers_[:,1],s=300,c='yellow',label='Centroids') plt.title('Kmeans Clustering') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend() plt.show() ``` 完整代码如下： ```python import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt data=pd.read_csv('data.csv') X=data.iloc[:,[0,1,2,3]].values kmeans=KMeans(n_clusters=3) y_kmeans=kmeans.fit_predict(X) plt.scatter(X[y_kmeans==0,0],X[y_kmeans==0,1],s=100,c='red',label='Cluster1') plt.scatter(X[y_kmeans==1,0],X[y_kmeans==1,1],s=100,c='blue',label='Cluster2') plt.scatter(X[y_kmeans==2,0],X[y_kmeans==2,1],s=100,c='green',label='Cluster3') plt.scatter(kmeans.cluster_centers_[:,0],kmeans.cluster_centers_[:,1],s=300,c='yellow',label='Centroids') plt.title('Kmeans Clustering') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend() plt.show() ``` 运行以上代码，即可得到可视化的Kmeans聚类结果。

阅读全文

Kmeans算法读取多维csv数据集分类并且可视化

相关推荐

数据挖掘 Kmeans 数据集

数据挖掘Kmeans算法

kmeans算法c语言实现，能对不同维度的数据进行聚类

KMeans++聚类算法Python实现与可视化指南

使用无监督学习的KMeans聚类方法对一个.csv文件中的四类多维数据进行分类预测，写出详细代码并解释，最后得出预测指数，并可视化展示

KMeans++算法【源程序】【Python】

数据处理与可视化分析实战（有详细注释）.zip

MATLAB读取Excel数据可视化和分析：数据洞察的利器

【R语言统计分析进阶】：深入kmeans统计原理，做数据背后的侦探

GOCAD数据可视化艺术

数据分析与可视化的工具与技术

ggmosaic包最佳实践案例集：行业专家的数据可视化分享

智能交互中的数据分析与可视化技术

数据可视化与报表分析技术

三维数据的聚类分析与可视化展示

CDO数据可视化：创新方法展示气候数据

【数据分析与可视化】：用Python进行深入数据探索的实用指南

视觉化时间序列分析：Anaconda中TimeSeries数据的【可视化策略】

【Arlequin数据可视化指南】：打造引人入胜的数据图表

MATLAB散点图与机器学习：数据预处理与可视化，助力模型构建

大家在看

TPS54160实现24V转正负15V双输出电源AD设计全方案

节的一些关于非传统-华为hcnp-数通题库2020/1/16（h12-221）v2.5

深圳大学《数据结构》1-4章练习题

【电子版】校招面试题库（附答案与解析）java篇-破解密码.pdf

ICCV2019无人机集群人体动作捕捉文章

最新推荐

Python——K-means聚类分析及其结果可视化

基于微信小程序的社区门诊管理系统php.zip

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

【单片机编程实战】：掌握流水灯与音乐盒同步控制的高级技巧

java 号码后四位用‘xxxx’脱敏