UCI Machine Learning Repository中的Breast Cancer Wisconsin (Diagnostic) Data Set数据集怎么导入
时间: 2024-03-25 22:41:17 浏览: 120
Breast Cancer Wisconsin (Diagnostic) Data Set-数据集
您可以使用如下代码来导入Breast Cancer Wisconsin (Diagnostic) Data Set数据集:
```python
import pandas as pd
# 从UCI Machine Learning Repository下载Breast Cancer Wisconsin (Diagnostic) Data Set数据集
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data"
df = pd.read_csv(url, header=None)
# 将数据集分为特征和目标变量
X = df.iloc[:, 2:].values
y = df.iloc[:, 1].values
# 将目标变量进行编码,M(恶性)为1,B(良性)为0
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
y = le.fit_transform(y)
```
这里我们使用`pandas`库来读取UCI Machine Learning Repository中的Breast Cancer Wisconsin (Diagnostic) Data Set数据集,然后将数据集分为特征和目标变量。最后,使用`LabelEncoder`来编码目标变量,将M(恶性)编码为1,将B(良性)编码为0。
阅读全文