import pandas as pd from sklearn.cluster import KMeans import matplotlib.pyplot as plt # 读取数据 data = pd.read_excel('C:/Users/86178/Desktop/test/test/TF-IDF/SSG hole span版.xlsx') # 提取特征列 feature_columns = ["Bridge length (m)","Pier type","Foundation type","Hole","Span (m)", "Bearing type","Plane linear"] X = data[feature_columns] # 创建KMeans对象 kmeans = KMeans(n_clusters=5) # 进行聚类 labels = kmeans.fit_predict(X) # 获取聚类中心 centroids = kmeans.cluster_centers_
时间: 2024-04-09 09:33:21 浏览: 28
很好,你成功地创建了KMeans对象并进行了聚类。现在你可以继续绘制散点图来展示聚类结果。
请继续添加以下代码来完成散点图的绘制:
```python
# 绘制散点图
plt.scatter(X["Bridge length (m)"], X["Span (m)"], c=labels)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', color='red', s=100)
plt.xlabel('Bridge length (m)')
plt.ylabel('Span (m)')
plt.title('K-means Clustering')
plt.show()
```
请注意,代码中的"Bridge length (m)"和"Span (m)"需要替换为你实际使用的特征列名称。这段代码将使用"Bridge length (m)"作为横坐标,"Span (m)"作为纵坐标,将数据点按照聚类结果进行着色,并将聚类中心以红色的"x"标记显示出来。最后,添加横纵坐标的标签和标题,并展示绘制的散点图。
相关问题
import pandas as pd import numpy as np from sklearn.cluster import DBSCAN import matplotlib.pyplot as plt from sklearn.cluster import KMeans
这段代码导入了pandas、numpy、matplotlib.pyplot和sklearn.cluster库,其中sklearn.cluster库中包括了DBSCAN和KMeans聚类算法。pandas和numpy库常用于数据处理和科学计算,matplotlib.pyplot库常用于数据可视化。你可以通过这些库来进行数据分析和聚类操作。
import pandas as pd import numpy as np from scipy import stats from sklearn.cluster import KMeans import matplotlib.pyplot as plt
这段代码的作用是导入一些常用的机器学习和数据分析库,包括pandas、numpy、scipy、sklearn和matplotlib.pyplot。其中,pandas和numpy用于数据处理和操作,scipy用于科学计算,sklearn用于机器学习算法,matplotlib用于数据可视化。另外,这段代码还使用了KMeans算法来进行聚类分析。