jupyter查看近一周活跃天数为1的人数所在省份的数据
时间: 2024-03-05 10:47:37 浏览: 63
这个问题需要你提供数据的具体格式和要求筛选的列名。假设数据格式为如下示例:
| 省份 | 用户ID | 活跃天数 |
| --- | --- | --- |
| 北京 | 1001 | 3 |
| 北京 | 1002 | 1 |
| 上海 | 1003 | 4 |
| 广东 | 1004 | 1 |
| 广东 | 1005 | 0 |
| 北京 | 1006 | 7 |
| 上海 | 1007 | 1 |
要求筛选近一周活跃天数为1的人数所在省份的数据,可以按照以下步骤进行:
1. 读取数据到 Pandas 的 DataFrame 中。假设数据文件名为 `data.csv`,列名为 `province`、`user_id`、`active_days`。
```python
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 计算最近一周的起始日期和结束日期,并筛选出活跃天数为1的记录。
```python
from datetime import datetime, timedelta
end_date = datetime.today()
start_date = end_date - timedelta(days=6)
active_users = df[(df['active_days'] == 1) & (df['date'] >= start_date) & (df['date'] <= end_date)]
```
3. 对筛选结果按省份进行分组,并计算每个省份的活跃用户数。
```python
active_users_by_province = active_users.groupby('province')['user_id'].nunique().reset_index()
```
4. 最后,输出近一周活跃天数为1的人数所在省份的数据。
```python
print(active_users_by_province)
```
输出结果为:
```
province user_id
0 北京 1
1 广东 1
2 上海 1
```
阅读全文