python实现垃圾邮件的识别
时间: 2023-08-20 12:04:11 浏览: 94
垃圾邮件的识别可以利用机器学习的方法来实现。下面是一个简单的 Python 代码示例:
```python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('spam.csv')
# 将邮件正文转化为向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(data['text'])
# 将标签转化为数字
y = data['label'].map({'ham': 0, 'spam': 1})
# 划分训练集和测试集
train_size = int(len(data) * 0.8)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]
# 训练模型
model = MultinomialNB()
model.fit(X_train, y_train)
# 测试模型
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
这个代码示例使用朴素贝叶斯分类器(MultinomialNB)来训练模型,并使用准确率(accuracy)来评估模型的性能。你可以将垃圾邮件数据集(spam.csv)替换为你自己的数据集,并根据需要修改代码。
阅读全文