多指标数据的聚类分析代码
时间: 2024-02-26 21:57:19 浏览: 64
以下是一个使用Python进行多指标数据聚类分析的示例代码,其中使用了K-Means聚类算法和最大-最小标准化方法:
```python
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv('data.csv')
# 提取数据矩阵
X = data.iloc[:, 1:].values
# 标准化处理
scaler = MinMaxScaler()
X_std = scaler.fit_transform(X)
# K-Means聚类
kmeans = KMeans(n_clusters=3, random_state=0).fit(X_std)
labels = kmeans.labels_
# 可视化展示
plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
```
其中,`data.csv`是一个包含多个指标数据的CSV文件,第一列为样本ID,后面各列为不同指标的取值。代码中,我们首先读取数据并提取数据矩阵,然后使用最大-最小标准化方法对数据进行标准化处理。接着,我们使用K-Means聚类算法对数据进行聚类,得到每个样本所属的类别。最后,我们使用散点图将聚类结果可视化展示出来,其中不同颜色表示不同的类别。
阅读全文