由 sklearn 生成,每个样本共两个特征,标签为 0 或 1。数据生成过 程中要求 random_state = 班级+学号后两位代码实现
时间: 2024-03-05 11:49:16 浏览: 60
Random_SMOTE_random_oceanxpq_数据生成_smote_
好的,您可以使用以下代码生成数据集:
```python
from sklearn.datasets import make_classification
# 填写班级和学号后两位,生成随机种子
random_state = 1016
# 生成数据集
X, y = make_classification(n_samples=100, n_features=2, n_informative=2, n_redundant=0, random_state=random_state)
# 输出数据集的形状和前五个样本的特征和标签
print("X shape:", X.shape)
print("y shape:", y.shape)
print("X[0:5]:\n", X[0:5])
print("y[0:5]:\n", y[0:5])
```
其中,`n_samples` 表示生成的样本数,`n_features` 表示每个样本的特征数,`n_informative` 表示有用特征的数量,`n_redundant` 表示冗余特征的数量。
这里生成的数据集共有 100 个样本,每个样本有 2 个特征,其中有用特征的数量为 2,冗余特征的数量为 0。您只需要将 `random_state` 的值设置为班级和学号后两位的和即可。
阅读全文