利用字典分别输出Iris和Mushroom的决策类名称和所包含的对象个数
时间: 2024-12-26 12:30:01 浏览: 2
在Python中,如果你有一个名为"Iris"和"Mushroom"的数据集,它们通常会被存储为Pandas DataFrame或者其他类似结构,每个数据集中有分类标签列和特征列。如果我们假设这两个数据集已经按照某种方式进行预处理,并且其中有一列用于表示类别(例如,'species'或'description'),你可以利用字典的形式来记录每个数据集的决策类别名称以及样本数量。
这里是一个示例:
```python
# 假设Iris和Mushroom的数据集已经被加载到DataFrame iris_df和mushroom_df中
# 获取Iris的决策类名称和对象(行)数
iris_dict = {
"决策类名称": iris_df["species"].unique().tolist(),
"对象个数": iris_df.shape[0]
}
# 获取Mushroom的决策类名称和对象数
mushroom_dict = {
"决策类名称": mushroom_df["description"].unique().tolist(),
"对象个数": mushroom_df.shape[0]
}
print("Iris 数据集:")
for key, value in iris_dict.items():
print(f"{key}: {value}")
print("\nMushroom 数据集:")
for key, value in mushroom_dict.items():
print(f"{key}: {value}")
```
在这个例子中,`unique()`函数会返回每个多类别字段中唯一的值列表,`shape[0]`则获取DataFrame的行数,即样本数。
阅读全文