对鸢尾花数据集进行统计分析
时间: 2024-06-12 14:10:47 浏览: 281
好的,针对鸢尾花数据集进行统计分析,您需要先下载数据集并导入到Python中。以下是代码示例:
```python
import pandas as pd
import seaborn as sns
# 读取数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',
header=None, names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'])
# 查看数据集前5行
print(iris.head())
# 统计每个类别的数量
print(iris['class'].value_counts())
# 统计每个特征的均值、标准差、最小值、最大值等信息
print(iris.describe())
```
输出结果如下:
```
sepal_length sepal_width petal_length petal_width class
5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
Iris-virginica 50
Iris-versicolor 50
Iris-setosa 50
Name: class, dtype: int64
sepal_length sepal_width petal_length petal_width
count 150.000000 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667 1.198667
std 0.828066 0.433594 1.764420 0.763161
min 4.300000 2.000000 1.000000 0.100000
25% 5.100000 2.800000 1.600000 0.300000
50% 5.800000 3.000000 4.350000 1.300000
75% 6.400000 3.300000 5.100000 1.800000
max 7.900000 4.400000 6.900000 2.500000
```
可以看到,数据集一共有150个样本,分为三个类别,每个类别有50个样本。另外,每个特征的均值、标准差、最小值、最大值等信息也被统计出来了。
阅读全文