如何使用sklearn生成随机数据集?
时间: 2024-02-21 09:54:14 浏览: 114
sklearn kaggle竞赛 泰坦尼克号幸存者数据集
可以使用sklearn.datasets中的多个方法来生成随机数据集。以下是两个常用的方法:
1.生成符合正态分布的聚类数据
```python
from sklearn.datasets import make_blobs
# 生成100个样本,每个样本有2个特征,分为3个簇,标准差为1.0
X, y = make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
```
2.生成符合正态分布的回归数据
```python
from sklearn.datasets import make_regression
# 生成100个样本,每个样本有2个特征,噪声为10.0
X, y = make_regression(n_samples=100, n_features=2, noise=10.0, random_state=None)
```
阅读全文