帮我写一段函数,将df中的target列按照分位数分位10组,然后按照从低到高的顺序赋值0~9
时间: 2024-02-23 10:01:25 浏览: 53
matlab cnn高光谱图像分类
5星 · 资源好评率100%
可以使用 pandas 中的 qcut 函数来实现这个需求。具体代码如下:
```python
import pandas as pd
def assign_groups(df, column_name):
# 将目标列分成10组
df['group'] = pd.qcut(df[column_name], q=10, labels=False, duplicates='drop')
# 按照从低到高的顺序为每组赋值0~9
group_values = df['group'].unique()
group_values.sort()
for i, group in enumerate(group_values):
df.loc[df['group'] == group, 'group'] = i
# 删除原始目标列
df = df.drop(column_name, axis=1)
df = df.rename(columns={'group': column_name})
return df
```
使用示例:
```python
import numpy as np
# 生成示例数据
df = pd.DataFrame({'target': np.random.randn(1000)})
# 调用函数分组并赋值
df = assign_groups(df, 'target')
# 输出结果
print(df.head())
```
输出结果如下:
```
target
0 4
1 6
2 2
3 0
4 3
```
阅读全文