统计鸢尾花每个品种的数量
时间: 2024-03-01 11:55:39 浏览: 54
我们可以使用 Scikit-learn 中的 `load_iris` 函数加载鸢尾花数据集,代码如下:
```python
from sklearn.datasets import load_iris
iris = load_iris()
```
加载数据集之后,我们可以将其转换为 Pandas 的 DataFrame 格式,并使用 `groupby()` 方法按照品种进行分组,并使用 `size()` 方法统计每个品种的数量,代码如下:
```python
import pandas as pd
df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['target'] = iris.target
df['target_name'] = df['target'].apply(lambda x: iris.target_names[x])
count = df.groupby('target_name').size()
print(count)
```
输出结果为:
```
target_name
setosa 50
versicolor 50
virginica 50
dtype: int64
```
其中,DataFrame `df` 存储了鸢尾花数据,`target` 列存储了每个样本所属的品种编号(0、1、2),`target_name` 列存储了品种名称(setosa、versicolor、virginica),`groupby()` 方法按照品种名称进行分组,`size()` 方法统计每个品种的数量。
阅读全文