Python实现数据集的kmeans聚类

K-means是一种经典的聚类算法，其目标是将数据集分成K个簇，使得簇内的点相似度高，簇间相似度低。下面是使用Python实现数据集的k-means聚类的示例代码： ```python import numpy as np import matplotlib.pyplot as plt # 生成随机数据 data = np.random.rand(100, 2) # 计算点之间的距离 def euclidean_distance(x1, x2): return np.sqrt(np.sum((x1 - x2)**2)) # 初始化聚类中心 def initialize_centroids(data, k): centroids = np.zeros((k, data.shape[1])) for i in range(k): centroid = data[np.random.choice(range(len(data)))] centroids[i] = centroid return centroids # 分配数据到最近的聚类中心 def assign_clusters(data, centroids): clusters = [[] for _ in range(len(centroids))] for sample_idx, sample in enumerate(data): centroid_idx = closest_centroid(sample, centroids) clusters[centroid_idx].append(sample_idx) return clusters # 计算距离最近的聚类中心 def closest_centroid(sample, centroids): distances = [euclidean_distance(sample, point) for point in centroids] closest_idx = np.argmin(distances) return closest_idx # 更新聚类中心 def update_centroids(data, clusters): centroids = np.zeros((len(clusters), data.shape[1])) for cluster_idx, cluster in enumerate(clusters): cluster_mean = np.mean(data[cluster], axis=0) centroids[cluster_idx] = cluster_mean return centroids # 判断聚类是否收敛 def has_converged(old_centroids, centroids): return (set([tuple(a) for a in old_centroids]) == set([tuple(a) for a in centroids])) # K-means算法 def kmeans(data, k): centroids = initialize_centroids(data, k) while True: old_centroids = centroids.copy() clusters = assign_clusters(data, centroids) centroids = update_centroids(data, clusters) if has_converged(old_centroids, centroids): break return centroids, clusters # 绘制聚类结果 def plot_clusters(data, clusters, centroids): colors = ['r', 'g', 'b', 'y', 'c', 'm'] fig, ax = plt.subplots() for cluster_idx, cluster in enumerate(clusters): cluster_color = colors[cluster_idx % len(colors)] for sample_idx in cluster: ax.scatter(data[sample_idx][0], data[sample_idx][1], c=cluster_color) centroid = centroids[cluster_idx] ax.scatter(centroid[0], centroid[1], c='black', marker='x', s=150) plt.show() # 运行K-means算法 centroids, clusters = kmeans(data, k=3) # 绘制聚类结果 plot_clusters(data, clusters, centroids) ``` 该代码生成了一个随机数据集，并将其分成3个簇。可以通过修改数据集和k值来尝试不同的聚类效果。

阅读全文

Python实现数据集的kmeans聚类

相关推荐

大数据的作业 基于python实现kmeans 是对球队强弱进行聚类+源代码+文档说明+数据

Python实现的KMeans聚类算法实例分析

kmeans聚类算法python实现

python实现鸢尾花Kmeans 聚类

【sklearn】xclara聚类数据集，python-sklearn，Kmeans聚类练手

Python实现实 Kmeans聚类算法

kmeans聚类：一维数据的kmeans聚类算法的实现

python实现kmeans聚类算法

"Python数据分析：Kmeans聚类及Anaconda配置

Python实现基于Waveform数据集的Kmeans聚类分析

基于python和sklearn实现kmeans聚类算法

用python写一个kmeans聚类算法

python实现文本kmeans聚类

matlabwine数据集kmeans聚类算法实例

用python写一个kmeans聚类算法，自己要生成数据集，并跑出结果

用python写一个kmeans聚类算法，不要太简单

Iris数据集Kmeans聚类分析，不使用sklearn中的方法

编写python代码实现kmeans聚类算法

python实现kmeans聚类画图

python实现kmeans聚类实例

大家在看

VITA 62.0.docx

新项目基于YOLOv8的人员溺水检测告警监控系统python源码(精确度高)+模型+评估指标曲线+精美GUI界面.zip

公安大数据零信任体系设计要求.pdf

批量标准矢量shp互转txt工具

HN8145XR-V5R021C00S260

最新推荐

Python——K-means聚类分析及其结果可视化

python实现鸢尾花三种聚类算法（K-means,AGNES,DBScan）

vb图书馆管理系统(源代码+论文)(20245j).7z

S7-PDIAG工具使用教程及技术资料下载指南

管理建模和仿真的文件

CC-LINK远程IO模块AJ65SBTB1现场应用指南：常见问题快速解决

python 画一个进度条

Nginx 1.19.0版本Windows服务器部署指南

"互动学习：行动中的多样性与论文攻读经历"

CC-LINK远程IO模块在环境监控中的应用：技术与案例探讨

大数据的作业基于python实现kmeans 是对球队强弱进行聚类+源代码+文档说明+数据