请给出k-mean代码,实现从工商数据中分别筛选出宾馆酒店、批发零售、网吧电竞、直播电商、中小制造 五类企业
时间: 2023-07-10 11:25:09 浏览: 98
K-mean算法代码
好的,以下是一个简单的Python实现的k-means聚类代码,可以用于从工商数据中筛选出宾馆酒店、批发零售、网吧电竞、直播电商、中小制造五类企业:
```python
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
# 读入工商数据
df = pd.read_csv("工商数据.csv")
# 将企业所属行业转换为数字标签
df["行业类别"] = df["行业类别"].map({"宾馆酒店": 0, "批发零售": 1, "网吧电竞": 2, "直播电商": 3, "中小制造": 4})
# 对数据进行标准化
data = df.iloc[:, 1:].apply(lambda x: (x - np.mean(x)) / np.std(x))
# 使用k-means聚类算法
kmeans = KMeans(n_clusters=5, random_state=0).fit(data)
# 打印每个企业所属的聚类中心
labels = kmeans.labels_
centers = kmeans.cluster_centers_
for i in range(5):
print("第%d类企业所属聚类中心:" % i)
print(centers[i])
print("")
# 将聚类结果添加到原数据中
df["聚类结果"] = labels
# 按照聚类结果筛选出宾馆酒店、批发零售、网吧电竞、直播电商、中小制造五类企业
guke = df[df["聚类结果"] == 0]["企业名称"].tolist()
pifa = df[df["聚类结果"] == 1]["企业名称"].tolist()
wangba = df[df["聚类结果"] == 2]["企业名称"].tolist()
zhubo = df[df["聚类结果"] == 3]["企业名称"].tolist()
zhizao = df[df["聚类结果"] == 4]["企业名称"].tolist()
```
需要注意的是,以上代码中的"工商数据.csv"应该替换为实际的工商数据文件名,并且需要根据实际情况调整k-means聚类算法的参数,如n_clusters等。
阅读全文