python中打开数据(transactions.csv)。 2、提取刷卡时间列,并将其转换为标准时间格式。 3、给数据集添加年份,月份,日,时等四列信息(注意:信息从时间列中提取)。 4、统计每年的刷卡金额平均值,并用柱形图绘制统计结果。 5、统计每天的刷卡金额平均值,并用折线图绘制统计结果。
时间: 2024-03-09 19:44:27 浏览: 54
customer-transactions.csv用户转化数据
好的,您的问题是如何使用Python处理交易数据并绘制统计图表。下面是实现这个任务的代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 1. 打开数据
df = pd.read_csv('transactions.csv')
# 2. 转换时间格式
df['time'] = pd.to_datetime(df['time'])
# 3. 添加时间信息
df['year'] = df['time'].dt.year
df['month'] = df['time'].dt.month
df['day'] = df['time'].dt.day
df['hour'] = df['time'].dt.hour
# 4. 统计每年的刷卡金额平均值
yearly_mean = df.groupby('year')['amount'].mean()
# 绘制柱形图
yearly_mean.plot(kind='bar')
plt.xlabel('Year')
plt.ylabel('Mean Amount')
plt.title('Yearly Mean Transaction Amount')
plt.show()
# 5. 统计每天的刷卡金额平均值
daily_mean = df.groupby(['year', 'month', 'day'])['amount'].mean()
# 绘制折线图
daily_mean.plot()
plt.xlabel('Date')
plt.ylabel('Mean Amount')
plt.title('Daily Mean Transaction Amount')
plt.show()
```
这段代码首先使用 `pandas` 库打开了一个名为 `transactions.csv` 的数据文件,然后将其中的时间列转换为标准时间格式,并从中提取了年份、月份、日期和小时等信息。接着,通过 `groupby` 方法统计了每年和每天的刷卡金额平均值,并分别用柱形图和折线图进行了可视化展示。
阅读全文