有一份电商销售数据,包含以下字段,含义如下: event_time,交易时间 order_id,订单id product_id,商品id category_id,类别id category_code,类别代码 brand,品牌 price, 价格 user_id, 用户id age,年龄 sex,性别 local,地理位置。用python代码完成一下消费的年龄信息 年龄分布比例 不同年龄下,总消费金额 不同年龄下,单次消费的平均消费金额 不同年龄人群使用的品牌分布画图
时间: 2024-03-07 09:49:57 浏览: 64
假设数据已经存储在一个名为"sales_data.csv"的文件中,可以使用以下代码来完成任务:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
sales_data = pd.read_csv("sales_data.csv")
# 年龄分布比例
age_distribution = sales_data["age"].value_counts(normalize=True)
print("年龄分布比例:")
print(age_distribution)
# 不同年龄下,总消费金额
total_spending_by_age = sales_data.groupby("age")["price"].sum()
print("不同年龄下,总消费金额:")
print(total_spending_by_age)
# 不同年龄下,单次消费的平均消费金额
avg_spending_by_age = sales_data.groupby("age")["price"].mean()
print("不同年龄下,单次消费的平均消费金额:")
print(avg_spending_by_age)
# 不同年龄人群使用的品牌分布画图
brand_distribution_by_age = pd.crosstab(sales_data["age"], sales_data["brand"])
brand_distribution_by_age.plot(kind="bar", stacked=True)
plt.title("不同年龄人群使用的品牌分布")
plt.xlabel("年龄")
plt.ylabel("数量")
plt.show()
```
注意:以上代码只是一个示例,具体实现依赖于数据的具体情况。
阅读全文