乳腺癌数据集聚类分析Python
时间: 2023-11-05 08:07:05 浏览: 191
首先,我们需要导入所需的库和数据集。在此示例中,我们将使用sklearn内置的乳腺癌数据集。
```python
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
import pandas as pd
import matplotlib.pyplot as plt
breast_cancer = load_breast_cancer()
data = pd.DataFrame(breast_cancer.data, columns=breast_cancer.feature_names)
```
接下来,我们可以使用KMeans算法对数据进行聚类。在这里,我们选择将数据分成两个簇。
```python
kmeans = KMeans(n_clusters=2)
kmeans.fit(data)
```
现在,我们可以使用KMeans的`predict`方法来预测每个数据点所属的簇。
```python
clusters = kmeans.predict(data)
```
最后,我们可以绘制数据点和聚类结果。
```python
plt.scatter(data.iloc[:, 0], data.iloc[:, 1], c=clusters)
plt.show()
```
完整代码如下:
```python
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
import pandas as pd
import matplotlib.pyplot as plt
breast_cancer = load_breast_cancer()
data = pd.DataFrame(breast_cancer.data, columns=breast_cancer.feature_names)
kmeans = KMeans(n_clusters=2)
kmeans.fit(data)
clusters = kmeans.predict(data)
plt.scatter(data.iloc[:, 0], data.iloc[:, 1], c=clusters)
plt.show()
```
这将生成散点图,其中蓝点表示一个簇,红点表示另一个簇。
阅读全文