帮我写一段代码,将df中的‘x’列按照行数平均分成20组,然后统计每一组中‘y’列每个对象的个数
时间: 2024-03-02 11:48:00 浏览: 55
统计3行3列二维数组中每行偶数的个数.cpp
好的,可以使用 pandas 库来实现该需求。代码如下:
```python
import pandas as pd
import numpy as np
# 读取包含 'x' 和 'y' 列的 DataFrame
df = pd.read_csv('data.csv')
# 将 'x' 列平均分成 20 组
n_rows = len(df)
n_groups = 20
group_size = n_rows // n_groups
group_indices = [(i*group_size, (i+1)*group_size) for i in range(n_groups)]
if group_indices[-1][1] != n_rows:
group_indices[-1] = (group_indices[-1][0], n_rows)
# 统计每一组中 'y' 列每个对象的个数
for i, (start_idx, end_idx) in enumerate(group_indices):
group_df = df.iloc[start_idx:end_idx, :]
count = group_df.groupby('y').size()
print(f'Group {i+1}:')
print(count)
```
请将 `data.csv` 替换成你所使用的数据文件名,并确保其中包含 'x' 和 'y' 两列数据。以上代码仅供参考,如有需要可根据实际情况进行修改。
阅读全文