帮我写一段代码,将df中的‘x’列按照行数平均分成20组,然后统计每一组中‘label’列的算数平均值
时间: 2024-03-02 16:50:28 浏览: 114
好的,我可以帮您写这段代码。首先,您需要确定每个数据点属于哪个组。可以使用 pandas.cut() 方法来实现。然后,您可以使用 groupby() 方法按组来计算每组中 'label' 列的平均值。下面是代码示例:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('your_file.csv')
# 将 'x' 列分成 20 组,每组的大小为数据行数 / 20
num_groups = 20
group_size = len(df) // num_groups
df['group'] = pd.cut(range(len(df)), bins=num_groups, labels=False)
# 按组计算 'label' 列的平均值
grouped = df.groupby('group')['label'].mean()
# 打印每个组的平均值
print(grouped)
```
这段代码假设您的数据存储在一个名为 'your_file.csv' 的文件中。您需要将代码中的文件名替换为您自己的文件名,并且将 'x' 和 'label' 列替换为您实际使用的列名。
阅读全文