基于Python,不调用sklearn库生成测试数据集
时间: 2023-07-13 10:09:51 浏览: 112
基于python sklearn的机器学习教程
生成测试数据集的方法有很多种,以下是一种基于Python的方法,不需要调用sklearn库:
```
import numpy as np
# 定义数据集大小
m = 1000
n = 10
# 随机生成特征矩阵X
X = np.random.rand(m, n)
# 随机生成标签向量y
y = np.random.rand(m)
# 将标签向量转换为二元分类问题
y = np.where(y > 0.5, 1, 0)
# 打印特征矩阵和标签向量的形状
print('X shape:', X.shape)
print('y shape:', y.shape)
```
这个例子中,我们生成了一个大小为1000x10的特征矩阵X和一个大小为1000的标签向量y,其中标签向量被转换为二元分类问题。你可以根据需要修改代码,生成不同大小和类型的数据集。
阅读全文