聚类分析实例研究python 撑死
时间: 2024-10-21 21:03:55 浏览: 15
聚类分析是一种无监督学习方法,用于将数据集中的对象分成自然分组或簇,相似的对象归于同一簇,而不同簇内的对象之间差异较大。在Python中,我们可以使用Scikit-Learn库来进行聚类分析,它提供了许多流行的算法如K-Means、层次聚类等。
例如,我们有一个电商网站用户的行为数据,想找出用户的消费习惯群体:
```python
from sklearn.cluster import KMeans
import pandas as pd
# 假设你已经有了用户数据df,包含特征如购买频率、平均消费额等
data = df[['frequency', 'average_spending']]
# 将数据标准化处理(因为KMeans对数值范围敏感)
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data)
# 定义模型并选择k值,比如基于肘部法则(Elbow Method)选择3个簇
kmeans = KMeans(n_clusters=3)
kmeans.fit(scaled_data)
# 添加聚类标签到原始数据
data['cluster'] = kmeans.labels_
# 现在你可以查看每个簇的用户特性,比如每个簇的平均购买频率和消费额
print(data.groupby('cluster').mean())
```
阅读全文