首页对NBA数据实现聚类分析的代码

对NBA数据实现聚类分析的代码

时间: 2023-10-26 22:12:57 浏览: 104

以下是使用Python实现对NBA数据进行聚类分析的示例代码： ```python import pandas as pd import numpy as np from sklearn.cluster import KMeans from sklearn.preprocessing import StandardScaler # 读取数据 data = pd.read_csv('nba_data.csv') # 数据预处理 data = data.dropna() # 删除缺失值 data = data.drop(columns=['Player', 'Pos', 'Tm']) # 删除非数值特征 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) # 数据标准化 # 选择聚类数 wcss = [] # 存储每个聚类数的WCSS for i in range(1, 11): kmeans = KMeans(n_clusters=i, init='k-means++', max_iter=300, n_init=10, random_state=0) kmeans.fit(data_scaled) wcss.append(kmeans.inertia_) # 绘制手肘图 import matplotlib.pyplot as plt plt.plot(range(1, 11), wcss) plt.title('Elbow Method') plt.xlabel('Number of clusters') plt.ylabel('WCSS') plt.show() # 选择聚类数为3，进行聚类分析 kmeans = KMeans(n_clusters=3, init='k-means++', max_iter=300, n_init=10, random_state=0) pred_y = kmeans.fit_predict(data_scaled) # 输出聚类结果 result = pd.DataFrame({'Player': data['Player'], 'Cluster': pred_y}) print(result) ``` 在这个示例代码中，我们使用了K-means算法对NBA数据进行聚类分析。首先进行了数据预处理，包括删除缺失值、删除非数值特征和数据标准化。然后使用手肘法选择聚类数，并进行了聚类分析。最后输出了聚类结果，包括每个球员所属的簇。

阅读全文