1、从本地读入数据,绘制良/恶性乳腺癌肿瘤测试集数据分布,良性肿瘤样本点标记为红色的O,恶性肿瘤样本点标记为黑色的×.画图。
时间: 2024-10-12 15:04:52 浏览: 27
在Python的数据可视化库matplotlib和sklearn的帮助下,你可以实现这个任务。首先,你需要导入必要的库,如`numpy`, `pandas`, `matplotlib.pyplot`以及`sklearn.datasets`。这里假设你已经加载了Breast Cancer Wisconsin (Diagnostic) 数据集:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
# 加载数据集
data = load_breast_cancer()
X = data.data
y = data.target
# 将数据分为良性(0)和恶性(1)
benign = X[y == 0]
malignant = X[y == 1]
# 绘制数据分布
fig, ax = plt.subplots(figsize=(8, 6))
ax.scatter(benign[:, 0], benign[:, 1], color='red', marker='o', label='Benign')
ax.scatter(malignant[:, 0], malignant[:, 1], color='black', marker='x', label='Malignant')
# 添加标签和标题
ax.set_xlabel('Feature 1')
ax.set_ylabel('Feature 2')
ax.set_title('Breast Cancer Tumor Data Distribution')
ax.legend()
plt.show()
```
在这个例子中,我们选择了数据集中前两个特征来进行二维空间的散点图展示。`scatter()`函数用于绘制点,其中颜色和标记分别对应于良性样本的红色圆形和恶性样本的黑色叉形。
阅读全文