R语言分析用户购买行为的代码
时间: 2023-10-11 09:10:40 浏览: 61
R语言数据分析案例之电商销售案例详解.pdf
以下是使用R语言进行用户购买行为分析的示例代码,包括数据预处理、特征工程和建立模型等步骤。
1. 数据预处理
首先,读入原始数据并进行清洗和预处理:
```
library(dplyr)
library(tidyr)
# 读入原始数据
data <- read.csv("data.csv")
# 去除重复数据
data <- distinct(data)
# 删除缺失值
data <- na.omit(data)
# 将日期转化为时间格式
data$date <- as.Date(data$date, "%Y-%m-%d")
# 将数据按用户和日期进行聚合
data_agg <- data %>%
group_by(user, date) %>%
summarize(total_amount = sum(amount),
total_items = sum(items))
```
2. 特征工程
接下来,将聚合后的数据进行特征工程,构造用户购买行为的特征:
```
# 计算用户的平均购买金额和购买数量
data_agg <- data_agg %>%
group_by(user) %>%
mutate(avg_amount = mean(total_amount),
avg_items = mean(total_items))
# 计算用户的购买频率和最近一次购买时间
data_agg <- data_agg %>%
group_by(user) %>%
mutate(purchase_freq = n(),
last_purchase_date = max(date))
# 将数据转化为宽格式
data_wide <- pivot_wider(data_agg,
names_from = date,
values_from = c(total_amount, total_items))
```
3. 建立模型
最后,使用建立好的特征数据,建立用户购买行为的预测模型。这里使用逻辑回归模型作为示例:
```
library(caret)
# 将数据集划分为训练集和测试集
set.seed(123)
trainIndex <- createDataPartition(data_wide$label, p = 0.8, list = FALSE)
data_train <- data_wide[trainIndex, ]
data_test <- data_wide[-trainIndex, ]
# 建立逻辑回归模型
model <- train(label ~ .,
data = data_train,
method = "glm",
family = "binomial")
# 在测试集上进行预测
predictions <- predict(model, newdata = data_test)
```
以上就是使用R语言进行用户购买行为分析的示例代码。需要注意的是,在实际使用中,需要根据具体情况进行修改和完善。
阅读全文