首页多维混合型数据聚类分析代码

多维混合型数据聚类分析代码

时间: 2023-09-22 08:05:59 浏览: 148

以下是一个基于K-Means算法的多维混合型数据聚类分析代码示例： ```python import numpy as np import pandas as pd from sklearn.cluster import KMeans # 读取数据 data = pd.read_csv('data.csv') # 选择特征 features = ['feature1', 'feature2', 'feature3', 'feature4'] # 对离散型特征进行One-Hot编码 data = pd.get_dummies(data, columns=['feature4']) # 将数据转换为矩阵 X = np.matrix(data[features]) # 定义聚类数 k = 3 # 定义K-Means模型 kmeans = KMeans(n_clusters=k, max_iter=1000) # 训练模型 kmeans.fit(X) # 获取聚类结果 labels = kmeans.labels_ # 输出结果 print(labels) ``` 在这个例子中，我们首先读取了一个数据集，并选择了其中的四个特征。对于离散型特征，我们使用了One-Hot编码。然后，我们将数据转换为矩阵，并定义了聚类数为3。接着，我们使用K-Means模型对数据进行训练，并获取聚类结果。最后，我们输出了聚类结果。需要注意的是，这个代码示例只是一个简单的例子，实际应用中可能需要对数据进行更多的预处理和特征选择，以及对聚类结果进行更详细的分析和评估。

阅读全文