乳腺癌数据集聚类分析代码，不使用sklearn，聚类设置簇个数为2，对聚类结果进行可视化

时间: 2024-05-06 18:16:36 浏览: 187

PaddleTS 是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验

以下是乳腺癌数据集的聚类分析代码，使用K-Means算法进行聚类，聚类设置簇个数为2，并对聚类结果进行可视化。 ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt # 读取数据 data = pd.read_csv('breast_cancer_data.csv') # 将标签列删除 X = data.drop(['label'], axis=1) # 将数据转换为numpy数组形式 X = np.array(X) # 定义K-Means算法 def KMeans(X, k=2, max_iter=100): # 随机选择k个中心点 centers = X[np.random.choice(X.shape[0], k, replace=False)] for i in range(max_iter): # 计算每个样本点到中心点的距离 distances = np.sqrt(((X - centers[:, np.newaxis])**2).sum(axis=2)) # 找到每个样本点距离最近的中心点 closest = np.argmin(distances, axis=0) # 更新中心点位置 for j in range(k): centers[j] = X[closest == j].mean(axis=0) return centers, closest # 聚类 centers, labels = KMeans(X, k=2) # 可视化聚类结果 plt.scatter(X[labels == 0][:, 0], X[labels == 0][:, 1], color='red', label='cluster 1') plt.scatter(X[labels == 1][:, 0], X[labels == 1][:, 1], color='blue', label='cluster 2') plt.scatter(centers[:, 0], centers[:, 1], marker='*', s=200, color='black', label='center') plt.legend() plt.show() ``` 说明： - 读取乳腺癌数据集，并将标签列删除，得到特征数据。 - 定义K-Means算法，随机选择k个中心点，不断更新中心点位置，直到达到最大迭代次数或中心点位置不再改变。 - 调用K-Means算法进行聚类，设置簇个数为2。 - 可视化聚类结果，将属于不同簇的样本点用不同颜色表示，将中心点用星号标注。

阅读全文

乳腺癌数据集聚类分析代码，不使用sklearn，聚类设置簇个数为2，对聚类结果进行可视化

相关推荐

白色大气风格的乐器爱好者网站模板下载.zip

海外派遣员工管理守则.docx

flowable-demo-master

图书管理系统-数据库设计报告.docx

白色风格的手机网站模板下载.rar

白色淡雅风的商务企业网站模板下载.zip

白色大气风格的企业站通用整站网站源码下载.zip

PCle AI加速卡在医疗影像诊断中的应用.docx

【图像压缩】基于matlab GUI Haar小波变换图像压缩（含PSNR）【含Matlab源码 9979期】.zip

白色大气简洁的时装模特企业网站模板下载.zip

西门子PLC 1214C 做的压机控制 可以在触摸屏上任意编辑压装逻辑 该程序为一台设备的完成程序 包含很多工能块 压机控制程序+汇川PN伺服块+脉冲控制块+以太网TCP功能块 + 气缸块+托盘

数据分析-58-谷歌应用市场的APP分析

“开学第一课”小学儿童教育家长会宣传模板.pptx

2024注册测绘师考试讲义-大地测量与海洋测绘

白色简洁风的设计企业网站模板下载.zip

VB+ACCESS学校田径运动会管理系统设计(源代码+系统+答辩)(20247x).7z

白色大气风格的恐龙化石博物馆网站模板下载.zip

白色简洁风格的餐厅会员登录框源码下载.zip

白色创意风格的单反爱好者网站模板下载.zip

最新推荐

Python——K-means聚类分析及其结果可视化

python 代码实现k-means聚类分析的思路(不使用现成聚类库)

Python实现简单层次聚类算法以及可视化

python实现鸢尾花三种聚类算法（K-means,AGNES,DBScan）

PaddleTS 是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

西门子PLC 1214C 做的压机控制可以在触摸屏上任意编辑压装逻辑该程序为一台设备的完成程序包含很多工能块压机控制程序+汇川PN伺服块+脉冲控制块+以太网TCP功能块 + 气缸块+托盘