只有浏览和购买2种行为方式的用户购买意向预测代码
时间: 2023-06-12 20:08:26 浏览: 125
KDD2019|基于注意力的深度学习如何实时预测购买还是浏览
这是一个简单的购买意向预测代码示例,基于用户的浏览和购买行为。假设我们有一个用户行为数据集,其中包含以下字段:
- user_id:用户ID
- item_id:商品ID
- behavior_type:用户行为类型(浏览、收藏、加购物车、购买)
- time:时间戳
```
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('user_behavior.csv')
# 筛选出浏览和购买行为的用户
data = data[data['behavior_type'].isin(['pv', 'buy'])]
# 构建特征矩阵和目标变量
X = pd.get_dummies(data[['user_id', 'item_id', 'behavior_type']])
y = data['behavior_type'].apply(lambda x: 1 if x == 'buy' else 0)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 训练随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=0)
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print('准确率:', accuracy)
```
这个代码示例使用了随机森林分类器作为预测模型,通过构建特征矩阵和目标变量来训练模型。特征矩阵包含用户ID、商品ID和行为类型的one-hot编码,目标变量是购买行为的二元分类(1表示购买,0表示浏览)。最后,使用测试集来评估模型的准确率。
阅读全文