python 利用Pandas 对数据分箱,统计每个箱中的数量
时间: 2023-12-06 07:44:39 浏览: 131
python实现连续变量最优分箱详解--CART算法
您好!感谢您使用 ChitGPT 进行对话。关于您的问题,下面是一些 Python 利用 Pandas 进行数据分箱并统计的示例代码:
```python
import pandas as pd
# 创建一个示例数据集
df = pd.DataFrame({'score': [52, 68, 72, 80, 85, 90, 92, 95, 98, 100]})
# 利用 pd.cut 进行数据分箱
bins = [50, 60, 70, 80, 90, 100] # 箱的边界值
df['score_bin'] = pd.cut(df['score'], bins)
# 利用 value_counts 统计每个箱中的数量
count = df['score_bin'].value_counts()
print(count)
```
在上面的例子中,我们首先创建了一个名为 `df` 的 DataFrame,其中包含 10 个分数。然后,我们使用 `pd.cut` 函数将这些分数划分到不同的箱中,每个箱的边界值由 `bins` 变量指定。最后,我们使用 `value_counts` 函数计算每个箱中的数量,并将结果打印出来。
希望这个示例代码可以帮助您解决问题。如有任何疑问,请随时向我提问。
阅读全文