首页可以导入房价数据的k-means聚类算法python代码

可以导入房价数据的k-means聚类算法python代码

时间: 2023-09-29 14:11:20 浏览: 113

以下是一个简单的 Python 代码示例，用于将房价数据导入并使用 K-Means 聚类算法进行聚类： ```python import numpy as np import pandas as pd from sklearn.cluster import KMeans from sklearn.preprocessing import StandardScaler # 读入数据 house_prices = pd.read_csv('house_prices.csv') # 选择需要聚类的特征 features = ['LotArea', 'YearBuilt', '1stFlrSF', '2ndFlrSF', 'FullBath', 'BedroomAbvGr', 'TotRmsAbvGrd'] # 对特征进行标准化 scaler = StandardScaler() scaled_features = scaler.fit_transform(house_prices[features]) # K-Means 聚类 kmeans = KMeans(n_clusters=3, random_state=0) kmeans.fit(scaled_features) # 打印每个聚类的样本数量 print(pd.Series(kmeans.labels_).value_counts()) # 将聚类结果添加到原始数据集中 house_prices['Cluster'] = kmeans.labels_ # 输出聚类结果 print(house_prices.groupby('Cluster')[features].mean()) ``` 在此示例中，我们从一个名为“house_prices.csv”的文件中加载数据，并选择要聚类的特征。然后，我们使用 `StandardScaler` 对特征进行标准化，以便在执行 K-Means 聚类算法时归一化所有特征值。接下来，我们使用 `KMeans` 类定义一个 K-Means 聚类模型，并将其与标准化的特征数据进行拟合。我们使用 `value_counts()` 函数打印每个聚类的样本数量，并将聚类结果作为一个新的列添加到原始数据集中。最后，我们输出每个聚类的平均特征值，以便更好地了解聚类结果。请注意，此示例仅用于说明如何使用 K-Means 聚类算法进行聚类，并且可能需要根据您的具体数据集进行更改。

阅读全文