西瓜书的西瓜数据4.0python代码可视化
时间: 2023-09-12 20:12:11 浏览: 23
好的,下面是一个简单的Python代码,用于加载和处理《机器学习》(西瓜书)中提供的西瓜数据4.0,并将其可视化:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 从CSV文件导入数据集
data = pd.read_csv('watermelon.csv')
X = data.iloc[:, [1, 2]].values
y = data.iloc[:, 9].values
# 将标签转化为数值型
y[y=='是'] = 1
y[y=='否'] = 0
y = y.astype('int')
# 绘制可视化图形
plt.scatter(X[y==1, 0], X[y==1, 1], c='red', marker='o', label='好瓜')
plt.scatter(X[y==0, 0], X[y==0, 1], c='green', marker='x', label='坏瓜')
plt.xlabel('密度')
plt.ylabel('含糖率')
plt.legend(loc='upper left')
plt.show()
```
该代码首先使用`pd.read_csv`函数从CSV文件中导入数据集,并将其存储在`data`中。然后,使用`iloc`函数选取第2列和第3列作为特征,并将其存储在`X`中。同时,将标签列存储在`y`中,并将标签转化为数值型。最后,使用`plt.scatter`函数绘制数据集的可视化图形。
运行代码前,请确保将`watermelon.csv`文件与代码放在同一目录下。而`watermelon.csv`文件应该包含8列特征和1列标签。
运行代码后,应该能够看到一个用密度和含糖率表示的西瓜数据集的可视化图形,其中红色点表示好瓜,绿色点表示坏瓜。
相关推荐















