可以导入房价数据的k-means聚类算法python代码
时间: 2023-09-29 17:11:20 浏览: 102
以下是一个简单的 Python 代码示例,用于将房价数据导入并使用 K-Means 聚类算法进行聚类:
```python
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
# 读入数据
house_prices = pd.read_csv('house_prices.csv')
# 选择需要聚类的特征
features = ['LotArea', 'YearBuilt', '1stFlrSF', '2ndFlrSF', 'FullBath', 'BedroomAbvGr', 'TotRmsAbvGrd']
# 对特征进行标准化
scaler = StandardScaler()
scaled_features = scaler.fit_transform(house_prices[features])
# K-Means 聚类
kmeans = KMeans(n_clusters=3, random_state=0)
kmeans.fit(scaled_features)
# 打印每个聚类的样本数量
print(pd.Series(kmeans.labels_).value_counts())
# 将聚类结果添加到原始数据集中
house_prices['Cluster'] = kmeans.labels_
# 输出聚类结果
print(house_prices.groupby('Cluster')[features].mean())
```
在此示例中,我们从一个名为“house_prices.csv”的文件中加载数据,并选择要聚类的特征。然后,我们使用 `StandardScaler` 对特征进行标准化,以便在执行 K-Means 聚类算法时归一化所有特征值。接下来,我们使用 `KMeans` 类定义一个 K-Means 聚类模型,并将其与标准化的特征数据进行拟合。我们使用 `value_counts()` 函数打印每个聚类的样本数量,并将聚类结果作为一个新的列添加到原始数据集中。最后,我们输出每个聚类的平均特征值,以便更好地了解聚类结果。
请注意,此示例仅用于说明如何使用 K-Means 聚类算法进行聚类,并且可能需要根据您的具体数据集进行更改。