读取horseColicTraining2.txt、horseColicTest2.txt文件中的数据,分别作为X_train, y_train ,X_test, y_test #要求上述数据集均为数组类型
时间: 2023-12-10 21:38:40 浏览: 79
读取数据集自动生成Darknet需要的train.txt与valid.txt文件
以下是读取文件并转换为数组的代码:
```python
import numpy as np
# 读取训练集数据
with open('horseColicTraining2.txt') as f:
data_train = [line.strip().split('\t') for line in f.readlines()]
X_train = np.array(data_train)[:, :-1].astype(float)
y_train = np.array(data_train)[:, -1].astype(int)
# 读取测试集数据
with open('horseColicTest2.txt') as f:
data_test = [line.strip().split('\t') for line in f.readlines()]
X_test = np.array(data_test)[:, :-1].astype(float)
y_test = np.array(data_test)[:, -1].astype(int)
```
其中,`with open()` 语句可以自动关闭文件,避免了手动关闭文件的繁琐过程。`strip()` 方法用于去除每行开头和结尾的空格和换行符,`split('\t')` 方法用于按照制表符分割每行数据。最后,`astype()` 方法将数据类型转换为 float(X) 或 int(y)。
阅读全文