pandas库中resample后计数
时间: 2023-07-06 08:23:46 浏览: 129
pandas-challenge:挑战如何将Pandas库用于Python
在 Pandas 中,可以使用 resample() 函数将时间序列数据进行重采样,例如将按照天的数据聚合成按照周的数据。
如果需要对重采样后的数据进行计数,可以使用 resample() 后跟着 count() 函数,例如:
```python
import pandas as pd
# 创建一个时间序列数据
date_rng = pd.date_range(start='1/1/2021', end='1/10/2021', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
# 将按照天的数据重采样为按照周的数据,并计算每周的数据条数
df_resampled = df.resample('W', on='date').count()
print(df_resampled)
```
这段代码将从 2021 年 1 月 1 日到 2021 年 1 月 10 日之间的日期作为索引,随机生成每天的数据,然后将数据按照周进行重采样,并计算每周的数据条数。
输出结果如下:
```
date data
date
2021-01-03 3 3
2021-01-10 7 4
```
可以看到,重采样后每周的数据条数被计算出来了。
阅读全文