不用去统计每天每个小时的评率,我想要这样的效果:2023-03-01,22:26-23:59;2023-03-03,22:19-23:58
时间: 2024-01-04 15:03:05 浏览: 63
GARCH-MIDAS、DDC-MIDAS模型MATLAB代码
5星 · 资源好评率100%
好的,您可以使用以下代码实现您的需求:
```python
import pandas as pd
# 读取数据到DataFrame
df = pd.read_csv('/Users/dashan/postgraduate/研一下/4_LIU_positive_compute/期末/期末作业-文本分析/期末作业-操作.csv', encoding='gbk')
# 将发布时间转换为日期类型
df['发布时间'] = pd.to_datetime(df['发布时间'])
# 提取日期和小时
df['日期'] = df['发布时间'].dt.date
df['小时'] = df['发布时间'].dt.hour
df['分钟'] = df['发布时间'].dt.minute
# 获取日期和小时的唯一值
dates = df['日期'].unique()
hours = df['小时'].unique()
# 打印每个日期和小时的组合
for date in dates:
for hour in hours:
mask = (df['日期'] == date) & (df['小时'] == hour)
if df[mask].empty:
continue
start_minute = df[mask]['分钟'].min()
end_minute = df[mask]['分钟'].max()
print("{},{}:{:02d}-{}:{:02d}".format(date, hour, start_minute, hour+1, end_minute))
```
这样,就可以输出每个日期和小时的组合,格式为"日期,小时:分钟-小时+1:分钟"。例如:"2023-03-01,22:26-23:59"。如果该小时内没有数据,则不会输出。
阅读全文