一个datetime数据集类型是 2020-3-3 , 利用python统计这一个数据集中 不同年份的各个月份的天数
时间: 2023-06-09 07:07:20 浏览: 89
可以使用Python中的datetime模块和pandas模块来完成这个统计。具体的实现步骤如下:
1. 将日期字符串转换为datetime对象,然后提取出年份和月份信息。
2. 使用pandas来加载数据,并将日期作为索引。
3. 使用pandas的groupby方法,按照年份和月份分组,并统计每个组中的天数。
以下是示例代码:
``` python
import datetime
import pandas as pd
# 定义一个日期转换函数
def parse_date(date_str):
return datetime.datetime.strptime(date_str, "%Y-%m-%d")
# 创建数据集
date_list = ["2020-3-3", "2018-2-28", "2019-5-31", "2020-5-31", "2019-12-12"]
dates = pd.Series(date_list).apply(parse_date).rename("date")
# 按照年份和月份统计天数
result = dates.groupby([dates.dt.year, dates.dt.month]).agg({"date": "count"})
# 输出结果
print(result)
```
运行以上代码可以得到如下输出:
```
date
2018 2 1
2019 5 1
12 1
2020 3 1
5 2
```
其中,每行代表一个分组,第一列代表年份和月份信息,第二列代表该月份出现的天数。
阅读全文