make_classification函数参数的意义
时间: 2023-10-13 21:07:30 浏览: 111
我们使用了make-classification函数来生成随机的三类分类数据集
5星 · 资源好评率100%
`sklearn.datasets.make_classification()`是用于生成随机分类数据集的函数,其重要参数及其意义如下:
- `n_samples`: 生成样本的数目。
- `n_features`: 生成样本的特征数。
- `n_informative`: 生成特征中用于分类的信息特征的数目。
- `n_redundant`: 生成特征中冗余的信息特征(可以通过其他特征推导出来)的数目。
- `n_classes`: 生成样本中的分类数目。
- `n_clusters_per_class`: 每个分类中的聚类数目。
- `weights`: 每个分类的样本权重。
- `random_state`: 随机种子。
`n_informative`和`n_redundant`的总和不能超过`n_features`。`n_clusters_per_class`默认为1,表示每个分类中只有一个聚类。`weights`默认为None,表示每个分类的样本权重相等。
阅读全文