make_blob创建函数库后,对数据集进行可视化,并对数据集按照1:3划分为测试集与训练集
时间: 2024-05-02 21:22:54 浏览: 67
python 划分数据集为训练集和测试集的方法
可以使用Python中的matplotlib库来对数据集进行可视化。可以使用如下的代码:
```python
import matplotlib.pyplot as plt
import numpy as np
# assuming data is a numpy array with shape (num_data_points, num_features)
data = np.random.rand(100, 2)
plt.scatter(data[:, 0], data[:, 1])
plt.show()
```
这样就可以将数据集以散点图的形式呈现出来。
接下来,可以使用scikit-learn库中的train_test_split函数来将数据集按照1:3划分为测试集与训练集。可以使用如下的代码:
```python
from sklearn.model_selection import train_test_split
# assuming data and labels are numpy arrays with the same number of rows
data_train, data_test, labels_train, labels_test = train_test_split(data, labels, test_size=0.25, random_state=42)
```
这里将数据集划分成75%的训练集和25%的测试集。`random_state`参数是为了保证每次运行结果相同。
阅读全文