jupyter按月份统计产品购买数量,消费金额,消费次数,消费人数
时间: 2023-08-05 20:47:19 浏览: 827
在 Jupyter Notebook 中,你可以使用 pandas 库来按月份统计产品购买数量、消费金额、消费次数和消费人数。假设你已经有了一列名为“订单日期”的数据列和一列名为“购买数量”的数据列,可以按照以下步骤进行操作:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 将订单日期转化为月份精度
df['订单日期'] = pd.to_datetime(df['订单日期'])
df['订单月份'] = df['订单日期'].dt.to_period('M')
# 按月份统计产品购买数量、消费金额、消费次数和消费人数
df_monthly = df.groupby('订单月份').agg({'购买数量': 'sum', '付款金额': 'sum', '订单号': 'count', '买家会员名': 'nunique'})
# 重命名列名
df_monthly = df_monthly.rename(columns={'购买数量': '产品购买数量', '付款金额': '消费金额', '订单号': '消费次数', '买家会员名': '消费人数'})
# 打印新的DataFrame
print(df_monthly.head())
```
在上述代码中,我们首先使用了 pandas 库中的 `pd.to_datetime()` 方法将订单日期转化为 datetime 格式,并使用了 `dt.to_period('M')` 方法将其转化为精度为月份的数据列。接下来,我们使用了 `groupby()` 方法按照订单月份进行分组,并使用了 `agg()` 方法对每个分组进行聚合操作,其中 `{'购买数量': 'sum', '付款金额': 'sum', '订单号': 'count', '买家会员名': 'nunique'}` 表示对“购买数量”求和、“付款金额”求和、“订单号”计数、“买家会员名”去重后计数。然后,我们将统计结果保存在了一个新的 DataFrame 中,并使用 `rename()` 方法重命名了列名。最后,我们使用 `print()` 函数打印了新的 DataFrame。
需要注意的是,如果你想要按照其他条件进行统计,可以根据需要修改 `groupby()` 和 `agg()` 方法中的参数。例如,如果你想要按照产品类别进行统计,可以将代码修改为:
```python
# 按产品类别统计产品购买数量、消费金额、消费次数和消费人数
df_category = df.groupby('产品类别').agg({'购买数量': 'sum', '付款金额': 'sum', '订单号': 'count', '买家会员名': 'nunique'})
# 重命名列名
df_category = df_category.rename(columns={'购买数量': '产品购买数量', '付款金额': '消费金额', '订单号': '消费次数', '买家会员名': '消费人数'})
# 打印新的DataFrame
print(df_category.head())
```
在上述代码中,我们使用了 `groupby()` 方法按照产品类别进行分组,然后使用了 `agg()` 方法对每个分组进行聚合操作,最后将统计结果保存在了一个新的 DataFrame 中,并使用 `rename()` 方法重命名了列名。
阅读全文