输出分割数据为训练集和测试集的代码
时间: 2023-04-06 07:03:58 浏览: 123
以下是一个简单的 Python 代码示例,用于将数据集分割为训练集和测试集:
```python
import numpy as np
def split_data(X, y, test_ratio=0.2):
"""
将数据集分割为训练集和测试集
:param X: 特征矩阵
:param y: 标签向量
:param test_ratio: 测试集比例
:return: (X_train, y_train, X_test, y_test)
"""
# 随机打乱数据集
indices = np.random.permutation(len(X))
X = X[indices]
y = y[indices]
# 计算测试集大小
test_size = int(len(X) * test_ratio)
# 分割数据集
X_test = X[:test_size]
y_test = y[:test_size]
X_train = X[test_size:]
y_train = y[test_size:]
return X_train, y_train, X_test, y_test
```
使用方法:
```python
# 假设 X 和 y 是特征矩阵和标签向量
X_train, y_train, X_test, y_test = split_data(X, y, test_ratio=0.2)
```
注意:这只是一个简单的示例代码,实际应用中可能需要更复杂的数据预处理和分割方法。
阅读全文