plt.scatter(data[:,0], data[:,1], c=labels) plt.scatter(centers[:,0], centers[:,1], marker='*', s=100, c='r')程序怎么修改可以增加图例
时间: 2024-01-14 12:02:59 浏览: 21
要在scatter图中添加图例,可以使用`legend()`函数。该函数的用法与上面提到的`plot()`函数相似,只需要在`scatter()`函数中添加`label`参数来指定每个数据集的标签,然后调用`legend()`函数即可。下面是修改后的代码:
```python
import matplotlib.pyplot as plt
# 假设有两个数据集,分别为data和centers
data = ...
labels = ...
centers = ...
# 绘制数据集
plt.scatter(data[:,0], data[:,1], c=labels, label='data')
# 绘制聚类中心
plt.scatter(centers[:,0], centers[:,1], marker='*', s=100, c='r', label='centers')
# 添加图例
plt.legend()
# 显示图像
plt.show()
```
在上面的代码中,我们在`scatter()`函数中添加了`label`参数,并分别为数据集和聚类中心指定了标签。然后,调用`legend()`函数来添加图例,函数会自动根据标签生成相应的图例。最后,使用`show()`函数来显示图像。
相关问题
完成填空 import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.datasets import make_blobs # 生成样例数据集 300条数据,4个类 std=2 data, labels = make_blobs( ) # 数据可视化 plt.scatter(data[:, 0], data[:, 1], s=50) plt.title("原始数据分布") plt.show() # K-means聚类分析 kmeans = #DBSCAN聚类分析 # 可视化聚类结果 plt.scatter(data[:, 0], data[:, 1], c=, s=50, cmap='viridis') #画出类中心 plt.scatter( , c='red', marker='x', s=200) plt.title("K-means聚类结果") plt.show() # 可视化聚类结果 plt.scatter(data[:, 0], data[:, 1], c=, s=50, cmap='viridis') #画出类中心 plt.scatter( , c='red', marker='x', s=200) plt.title("DBSCAN聚类结果") plt.show()
完成代码如下:
```
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans, DBSCAN
from sklearn.datasets import make_blobs
# 生成样例数据集 300条数据,4个类 std=2
data, labels = make_blobs(n_samples=300, centers=4, cluster_std=2)
# 数据可视化
plt.scatter(data[:, 0], data[:, 1], s=50)
plt.title("原始数据分布")
plt.show()
# K-means聚类分析
kmeans = KMeans(n_clusters=4)
kmeans.fit(data)
# DBSCAN聚类分析
dbscan = DBSCAN(eps=1.5, min_samples=5)
dbscan.fit(data)
# 可视化聚类结果
plt.scatter(data[:, 0], data[:, 1], c=kmeans.labels_, s=50, cmap='viridis') # K-means聚类结果
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], c='red', marker='x', s=200) # 画出类中心
plt.title("K-means聚类结果")
plt.show()
plt.scatter(data[:, 0], data[:, 1], c=dbscan.labels_, s=50, cmap='viridis') # DBSCAN聚类结果
plt.scatter(data[dbscan.core_sample_indices_][:, 0], data[dbscan.core_sample_indices_][:, 1], c='red', marker='x', s=200) # 画出核心点
plt.title("DBSCAN聚类结果")
plt.show()
```
import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans # 生成随机数据 np.random.seed(0) X = np.random.randn(1000, 2) # 使用K-means算法进行聚类 kmeans = KMeans(n_clusters=3) kmeans.fit(X) labels = kmeans.labels_ centers = kmeans.cluster_centers_ # 可视化聚类结果 plt.scatter(X[:, 0], X[:, 1], c=labels) plt.scatter(centers[:, 0], centers[:, 1], marker='x', color='red') plt.title('Clustering Visualization') plt.xlabel('X') plt.ylabel('Y') plt.show()代码讲解
这段代码是使用K-means算法对随机生成的二维数据进行聚类,并可视化聚类结果。让我逐行解释一下代码的功能:
1. 导入必要的库:
```
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
```
这里导入了NumPy用于处理数据,Matplotlib用于数据可视化,以及scikit-learn库中的KMeans类用于执行K-means聚类。
2. 生成随机数据:
```
np.random.seed(0)
X = np.random.randn(1000, 2)
```
使用`np.random.randn`函数生成1000个服从标准正态分布的二维数据点。
3. 使用K-means算法进行聚类:
```
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
labels = kmeans.labels_
centers = kmeans.cluster_centers_
```
创建一个KMeans对象,并指定要聚类的簇数为3。然后使用`fit`方法对数据进行聚类,并获取每个样本点的标签和聚类中心。
4. 可视化聚类结果:
```
plt.scatter(X[:, 0], X[:, 1], c=labels)
plt.scatter(centers[:, 0], centers[:, 1], marker='x', color='red')
plt.title('Clustering Visualization')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()
```
使用`plt.scatter`函数将数据点按照聚类结果进行散点图展示,其中`c=labels`参数用于指定不同聚类的颜色。再使用`plt.scatter`函数将聚类中心以红色叉形标记出来。最后设置图的标题、x轴和y轴标签,并使用`plt.show`显示图像。
这样,代码就完成了数据的聚类和可视化展示。