构造用户画像代码
时间: 2023-08-06 17:14:05 浏览: 101
以下是一个简单的用户画像构造代码示例,基于用户的行为和属性数据:
```python
import pandas as pd
# 读取用户数据
user_data = pd.read_csv('user_data.csv')
# 计算用户活跃度
user_data['activity_score'] = user_data['login_count'] + user_data['comment_count'] + user_data['post_count']
# 计算用户消费能力
user_data['spending_score'] = user_data['order_count'] * user_data['average_order_value']
# 计算用户偏好
user_data['preference_score'] = user_data['category1_count'] + user_data['category2_count'] + user_data['category3_count']
# 将分数标准化到[0, 1]范围内
for col in ['activity_score', 'spending_score', 'preference_score']:
user_data[col] = (user_data[col] - user_data[col].min()) / (user_data[col].max() - user_data[col].min())
# 计算综合用户画像
user_data['user_profile'] = user_data.apply(lambda x:
('active' if x['activity_score'] > 0.5 else 'inactive') +
(' high_spender' if x['spending_score'] > 0.5 else ' low_spender') +
(' fashionista' if x['preference_score'] > 0.5 else ' practical'),
axis=1)
# 输出用户画像
print(user_data['user_profile'])
```
以上代码假设用户数据保存在一个名为 `user_data.csv` 的文件中,包含登录次数、评论次数、发帖次数、订单次数、平均订单金额、三种商品类别的购买次数等属性。代码根据这些属性计算用户活跃度、消费能力和偏好得分,然后将这些分数标准化到[0, 1]范围内。最后,根据不同分数区间,为每个用户构建一个简单的用户画像,包括活跃度、消费能力和偏好等方面的特征。
阅读全文