Python中pandas条件分类打标签
时间: 2023-11-24 15:20:12 浏览: 37
在Python中,可以使用Pandas库中的`.loc`和`.iloc`方法对数据进行条件分类打标签。
举个例子,假设我们有一个包含身高和体重信息的DataFrame,现在需要根据身高和体重的值,将数据分成瘦高、胖高、瘦矮和胖矮四个类别,并将分类结果打上标签。代码如下:
```python
import pandas as pd
# 创建DataFrame
data = {'身高': [175, 180, 160, 165, 170, 172],
'体重': [60, 80, 55, 70, 75, 68]}
df = pd.DataFrame(data)
# 根据身高和体重进行分类打标签
df.loc[(df['身高'] >= 175) & (df['体重'] >= 75), '标签'] = '胖高'
df.loc[(df['身高'] >= 175) & (df['体重'] < 75), '标签'] = '瘦高'
df.loc[(df['身高'] < 175) & (df['体重'] >= 75), '标签'] = '胖矮'
df.loc[(df['身高'] < 175) & (df['体重'] < 75), '标签'] = '瘦矮'
print(df)
```
输出结果为:
```
身高 体重 标签
0 175 60 瘦高
1 180 80 胖高
2 160 55 瘦矮
3 165 70 瘦矮
4 170 75 瘦矮
5 172 68 瘦矮
```
以上代码中,使用`.loc`方法根据身高和体重的值,分别将数据分成四个类别,并将分类结果打上标签,最终得到一个新的DataFrame。
需要注意的是,以上方法适用于分类标准比较简单的情况。如果分类标准比较复杂,可以考虑使用其他的分类方法,比如机器学习中的决策树分类方法等。