kmeans文本聚类算法python
时间: 2023-08-12 16:09:45 浏览: 116
K-means是一种经典的聚类算法,用于对数据进行分类。在Python中,可以使用sklearn库中的KMeans类来实现该算法。可以使用以下代码示例来进行文本聚类:
```python
from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
# 获取每个样本所属的簇
labels = kmeans.labels_
print(labels) # 输出: [1 1 1 0 0 0]
# 预测新的数据点所属的簇
new_data = np.array([[0, 0], [12, 3]])
predictions = kmeans.predict(new_data)
print(predictions) # 输出: [1 0]
# 获取每个簇的中心点
centers = kmeans.cluster_centers_
print(centers) # 输出: [[10. 2.] [ 1. 2.]]
```
这里的X是输入数据,每行代表一个样本,每列代表一个特征。n_clusters表示要分成的簇的数量,random_state是用于初始化选取簇中心的随机数种子。labels数组表示每个样本所属的簇,predictions表示新的数据点所属的簇,centers数组表示每个簇的中心点。你可以根据实际情况修改X的数据和n_clusters的值来满足你的需求。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* [Python实现聚类K-means算法](https://blog.csdn.net/wyn1564464568/article/details/125782286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
- *3* [Python实现Kmeans文本聚类](https://blog.csdn.net/zkkkkkkkkkkkkk/article/details/125555835)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文