朴素贝叶斯算法判断男女代码
时间: 2024-11-12 15:14:15 浏览: 9
朴素贝叶斯算法是一种基于概率统计的分类方法,在文本分类、垃圾邮件识别等场景中广泛应用。用于二分类任务,比如预测一个人的性别。下面是一个简单的Python示例,假设我们有一份包含用户特征的数据集(如年龄、收入、教育程度等),并已知一部分人的性别信息:
```python
from sklearn.naive_bayes import GaussianNB
import pandas as pd
# 假设我们有一个DataFrame df,其中'gender'列是我们要预测的目标变量,其他列是特征
# gender列有0(男)和1(女)
data = pd.read_csv('gender_data.csv')
# 分割数据集为特征(X)和目标变量(y)
X = data.drop('gender', axis=1)
y = data['gender']
# 创建朴素贝叶斯分类器
gnb = GaussianNB()
# 使用训练数据拟合模型
gnb.fit(X, y)
# 对新数据进行预测
new_person = {'age': 30, 'income': 50000, 'education': '大学'} # 假设的新样本
prediction = gnb.predict([new_person])
# 预测结果
if prediction[0] == 0:
print("这个人可能是男性")
else:
print("这个人可能是女性")
阅读全文