首页numpy读入csv波士顿数据集

numpy读入csv波士顿数据集

时间: 2023-11-10 20:08:55 浏览: 120

以下是使用numpy读取波士顿数据集的示例代码： ```python import numpy as np # 读取csv文件 data = np.genfromtxt('boston.csv', delimiter=',', skip_header=1) # 分离特征和标签 X = data[:, :-1] # 所有行，除了最后一列 y = data[:, -1] # 所有行，最后一列 # 打印前5个样本的特征和标签 print('X:', X[:5]) print('y:', y[:5]) ``` 注意，需要将波士顿数据集的csv文件放在当前工作目录下，或者提供完整的文件路径。在上面的代码中，我们使用`np.genfromtxt()`函数读取csv文件，并使用`delimiter=','`指定分隔符为逗号，`skip_header=1`跳过第一行标题行。然后，我们将特征和标签分别存储在`X`和`y`中。最后，我们打印前5个样本的特征和标签。

numpy读入波士顿数据集

波士顿房价数据集是一个经典的回归问题数据集，包含了506个样本和13个特征，其中每个样本代表了波士顿地区的一些房屋的信息，目标是预测该地区房屋的中位数价格。在numpy中可以使用loadtxt函数读入波士顿数据集。具体代码如下： ```python import numpy as np # 读入数据集 data = np.loadtxt('housing.data') # 分离特征和标签 X = data[:, :-1] y = data[:, -1] # 打印数据集形状 print('数据集形状：', X.shape, y.shape) ``` 在上面的代码中，先使用numpy的loadtxt函数读入housing.data文件，将所有样本和特征存储在一个二维数组中。然后通过切片操作将特征和标签分离出来，其中X代表特征，y代表标签。最后打印数据集的形状，可以看到X有506行和13列，y有506个元素。

阅读全文