多维混合型数据聚类分析代码
时间: 2023-09-22 08:05:59 浏览: 148
以下是一个基于K-Means算法的多维混合型数据聚类分析代码示例:
```python
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
# 读取数据
data = pd.read_csv('data.csv')
# 选择特征
features = ['feature1', 'feature2', 'feature3', 'feature4']
# 对离散型特征进行One-Hot编码
data = pd.get_dummies(data, columns=['feature4'])
# 将数据转换为矩阵
X = np.matrix(data[features])
# 定义聚类数
k = 3
# 定义K-Means模型
kmeans = KMeans(n_clusters=k, max_iter=1000)
# 训练模型
kmeans.fit(X)
# 获取聚类结果
labels = kmeans.labels_
# 输出结果
print(labels)
```
在这个例子中,我们首先读取了一个数据集,并选择了其中的四个特征。对于离散型特征,我们使用了One-Hot编码。然后,我们将数据转换为矩阵,并定义了聚类数为3。接着,我们使用K-Means模型对数据进行训练,并获取聚类结果。最后,我们输出了聚类结果。
需要注意的是,这个代码示例只是一个简单的例子,实际应用中可能需要对数据进行更多的预处理和特征选择,以及对聚类结果进行更详细的分析和评估。
阅读全文