pd categorical
时间: 2024-05-01 19:22:46 浏览: 129
`pd.Categorical` 是 Pandas 中的一个数据类型,它表示具有有限数量的可能值的数据。这种数据类型通常用于分类变量,例如颜色、性别、品牌等。
创建 `pd.Categorical` 对象的最基本方法是使用 `pd.Categorical()` 函数。以下是一个示例:
``` python
import pandas as pd
data = pd.Series(['low', 'low', 'high', 'medium', 'low', 'high', 'medium'])
categories = ['low', 'medium', 'high']
cat_data = pd.Categorical(data, categories=categories, ordered=True)
print(cat_data)
```
上述代码创建了一个 `pd.Series` 对象,其中包含一些分类数据。然后,使用 `pd.Categorical()` 函数将该序列转换为 `pd.Categorical` 对象。在这里,我们还指定了 `categories` 参数和 `ordered` 参数,以指定分类变量的可能值和排序方式。
输出结果如下:
```
['low', 'low', 'high', 'medium', 'low', 'high', 'medium']
Categories (3, object): ['low' < 'medium' < 'high']
```
可以看到,输出结果显示了原始数据,以及 `Categories` 属性,其中包含了所有可能值和它们的顺序。
阅读全文