首页基于Python，不调用sklearn库生成测试数据集

基于Python，不调用sklearn库生成测试数据集

时间: 2023-07-13 10:09:51 浏览: 112

基于python sklearn的机器学习教程

本教程是在学习机器学习的过程中的记录并进行整理之后的教程

生成测试数据集的方法有很多种，以下是一种基于Python的方法，不需要调用sklearn库： ``` import numpy as np # 定义数据集大小 m = 1000 n = 10 # 随机生成特征矩阵X X = np.random.rand(m, n) # 随机生成标签向量y y = np.random.rand(m) # 将标签向量转换为二元分类问题 y = np.where(y > 0.5, 1, 0) # 打印特征矩阵和标签向量的形状 print('X shape:', X.shape) print('y shape:', y.shape) ``` 这个例子中，我们生成了一个大小为1000x10的特征矩阵X和一个大小为1000的标签向量y，其中标签向量被转换为二元分类问题。你可以根据需要修改代码，生成不同大小和类型的数据集。

阅读全文