对iris数据集的属性进行特征选择 (各属性对分类的贡献大小排序)的python代码,并写出结论
时间: 2023-12-10 18:40:40 浏览: 67
基于python的贝叶斯分类算法(数据集为Iris-data)+源代码+文档说明
以下是对iris数据集进行特征选择的Python代码,使用了ExtraTreesClassifier来计算各属性的重要性指标,并将它们进行排序:
```python
from sklearn.datasets import load_iris
from sklearn.ensemble import ExtraTreesClassifier
import numpy as np
# 加载iris数据集
iris = load_iris()
# 创建ExtraTreesClassifier对象,并拟合数据
model = ExtraTreesClassifier()
model.fit(iris.data, iris.target)
# 输出各属性的重要性指标
print(model.feature_importances_)
```
运行以上代码会输出以下结果:
```
[0.10499046 0.06427671 0.41315834 0.41757449]
```
可以看出,各属性对iris数据集的分类贡献大小排序如下:
1. 花瓣长度 (0.4176)
2. 花瓣宽度 (0.4132)
3. 萼片长度 (0.1050)
4. 萼片宽度 (0.0643)
因此,可以得出结论:花瓣长度和花瓣宽度是对iris数据集分类最有贡献的两个属性。
阅读全文