Python机器学习-朴素贝叶斯代码实现:天池大赛天猫复购预测
时间: 2024-12-13 11:19:41 浏览: 20
在Python中,朴素贝叶斯算法常用于文本分类问题,如电商场景下的用户购买行为预测。例如,在天池大赛天猫复购预测任务中,可以利用用户的浏览历史、购买记录等信息训练一个朴素贝叶斯模型来预测用户是否会进行再次购买。以下是使用scikit-learn库实现一个简单朴素贝叶斯分类器的基本步骤:
```python
# 导入所需的库
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
import pandas as pd
# 加载数据集
data = pd.read_csv('tianchi_mtm_dataset.csv') # 假设这是比赛的数据文件名
# 数据预处理:假设我们有特征列X和目标变量y
X = data.drop('is_repeated_buy', axis=1) # 列表删除目标列
y = data['is_repeated_buy'] # 目标列
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练朴素贝叶斯模型
gnb = GaussianNB()
gnb.fit(X_train, y_train)
# 预测
predictions = gnb.predict(X_test)
# 评估模型性能
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions)
print(f"Accuracy: {accuracy}")
阅读全文