k均值聚类 python
时间: 2023-11-05 14:05:43 浏览: 60
k均值聚类是一种常见的无监督学习算法,可以将数据集划分为k个簇,每个簇内的数据点相似度较高,不同簇之间的相似度较低。在Python中,可以使用scikit-learn库中的KMeans类来实现k均值聚类。
以下是一个简单的k均值聚类的Python示例代码:
```python
from sklearn.cluster import KMeans
import numpy as np
# 生成随机数据
X = np.random.rand(100, 2)
# 创建KMeans模型并拟合数据
kmeans = KMeans(n_clusters=3, random_state=0).fit(X)
# 输出每个数据点所属的簇
print(kmeans.labels_)
```
相关问题
k均值聚类python
k均值聚类算法是一种常用的聚类算法,用于将数据集划分为k个不同的簇。在python中,可以使用sklearn库中的KMeans类来实现k均值聚类算法。以下是一个示例代码:
```python
from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
labels = kmeans.labels_
centers = kmeans.cluster_centers_
print("每个数据点所属的簇标签:", labels)
print("每个簇的中心点坐标:", centers)
```
这段代码使用sklearn库中的KMeans类对输入数据X进行聚类,并得到每个数据点所属的簇标签和每个簇的中心点坐标。在这个例子中,输入数据X是一个二维数组,包含了6个数据点,每个数据点有两个特征。通过设置n_clusters参数为2,即将数据集划分为两个簇。聚类结果保存在labels变量中,每个数据点对应的簇标签,而centers变量保存了每个簇的中心点坐标。
请注意,这只是一个简单的示例,实际应用中,可以根据需要调整参数并针对具体的数据集进行适当的调整。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [Python实现聚类K-means算法](https://blog.csdn.net/wyn1564464568/article/details/125782286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
k均值聚类python源码
以下是使用Python实现k均值聚类的源码示例:
```python
from sklearn.cluster import KMeans
import numpy as np
# 准备数据
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# 创建并训练k均值聚类模型
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
# 获取聚类结果
labels = kmeans.labels_
centers = kmeans.cluster_centers_
# 打印聚类结果
print("聚类标签:", labels)
print("簇中心坐标:", centers)
```
以上代码使用了scikit-learn库中的KMeans类,首先定义了一个数据集X,然后通过创建并训练KMeans对象,可以得到每个样本点的聚类标签和簇中心坐标。