python 筛选时段
时间: 2025-01-02 17:39:45 浏览: 9
### 使用 Pandas 进行时间筛选
Pandas 是 Python 中用于数据操作的强大库,提供了多种方式来处理和筛选时间序列数据。为了实现基于特定时间段的数据过滤,可以利用 `pandas` 的日期功能。
假设有一个包含时间戳索引的 DataFrame:
```python
import pandas as pd
import numpy as np
# 创建带有时间戳索引的数据框
dates = pd.date_range('20230101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
```
要从上述 DataFrame 中选取某个具体的时间范围内的记录,可以通过如下方式进行切片操作:
```python
start_date = '2023-01-02'
end_date = '2023-01-05'
filtered_df = df.loc[start_date:end_date]
print(filtered_df)
```
如果想要更复杂的查询条件,比如只获取工作日的数据,则可采用布尔掩码的方式来进行更加灵活的选择[^1]:
```python
mask = (df.index.weekday < 5) # 周六周日分别为5和6
workdays_only = df[mask]
print(workdays_only)
```
对于按月或年的聚合统计也可以很方便地完成,这有助于分析不同周期下的趋势变化情况:
```python
monthly_data = df.resample('M').mean()
yearly_data = df.resample('Y').sum()
print(monthly_data)
print(yearly_data)
```
通过这些方法能够有效地对时间序列数据集执行各种类型的筛选与汇总计算,满足不同的业务需求[^2]。
阅读全文