划分训练集和测试集python代码
时间: 2023-08-23 08:06:41 浏览: 137
以下是一个简单的 Python 代码示例,用于将数据集分成训练集和测试集:
```python
import numpy as np
# 载入整个数据集
data = np.loadtxt('data.csv', delimiter=',')
# 随机打乱数据
np.random.shuffle(data)
# 划分训练集和测试集的比例
train_ratio = 0.8
# 计算训练集和测试集的数量
train_size = int(train_ratio * len(data))
test_size = len(data) - train_size
# 划分训练集和测试集
train_data = data[:train_size]
test_data = data[train_size:]
print(f'Train data size: {len(train_data)}')
print(f'Test data size: {len(test_data)}')
```
上述代码中,假设数据存储在名为 `data.csv` 的 CSV 文件中。首先,我们使用 `numpy` 库来将数据加载到一个名为 `data` 的 NumPy 数组中。然后,我们使用 `np.random.shuffle()` 函数来随机打乱数据顺序。接下来,我们使用 `train_ratio` 变量指定训练集所占比例,计算出训练集和测试集的数量。最后,我们使用 NumPy 数组切片来提取训练集和测试集,并打印它们的大小。
相关问题
python 从原始数据划分训练集和测试集 代码
Python可以使用sklearn库中的train_test_split()函数来从原始数据划分训练集和测试集,代码如下:from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0)
用python写一段代码划分数据集,分成训练集和测试集
以下是一段使用sklearn库划分数据集的Python代码,将数据集分为训练集和测试集:
```python
from sklearn.model_selection import train_test_split
# 假设X为特征数据,y为标签数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# test_size表示测试集所占比例,random_state用于指定随机数生成器的种子
```
其中,train_test_split函数将数据集划分为训练集和测试集,并返回划分后的数据集,其中test_size指定测试集所占的比例。通过指定random_state,可以保证每次运行代码时,得到的划分结果都是一样的。
阅读全文
相关推荐
















