numpy读入csv波士顿数据集
时间: 2023-11-10 20:08:55 浏览: 120
以下是使用numpy读取波士顿数据集的示例代码:
```python
import numpy as np
# 读取csv文件
data = np.genfromtxt('boston.csv', delimiter=',', skip_header=1)
# 分离特征和标签
X = data[:, :-1] # 所有行,除了最后一列
y = data[:, -1] # 所有行,最后一列
# 打印前5个样本的特征和标签
print('X:', X[:5])
print('y:', y[:5])
```
注意,需要将波士顿数据集的csv文件放在当前工作目录下,或者提供完整的文件路径。在上面的代码中,我们使用`np.genfromtxt()`函数读取csv文件,并使用`delimiter=','`指定分隔符为逗号,`skip_header=1`跳过第一行标题行。然后,我们将特征和标签分别存储在`X`和`y`中。最后,我们打印前5个样本的特征和标签。
相关问题
numpy读入波士顿数据集
波士顿房价数据集是一个经典的回归问题数据集,包含了506个样本和13个特征,其中每个样本代表了波士顿地区的一些房屋的信息,目标是预测该地区房屋的中位数价格。在numpy中可以使用loadtxt函数读入波士顿数据集。具体代码如下:
```python
import numpy as np
# 读入数据集
data = np.loadtxt('housing.data')
# 分离特征和标签
X = data[:, :-1]
y = data[:, -1]
# 打印数据集形状
print('数据集形状:', X.shape, y.shape)
```
在上面的代码中,先使用numpy的loadtxt函数读入housing.data文件,将所有样本和特征存储在一个二维数组中。然后通过切片操作将特征和标签分离出来,其中X代表特征,y代表标签。最后打印数据集的形状,可以看到X有506行和13列,y有506个元素。
阅读全文
相关推荐













