利用scam对iris 数据进行分类,自定义合理的训练集和测试集比例。根据混淆矩阵,输出模型在三分类上的准确率、召回率、查准率和Flscore 值
时间: 2024-03-12 09:44:22 浏览: 130
scam:已知诈骗号码和网站列表
好的,以下是利用 Scam 对 Iris 数据集进行分类的步骤:
1. 导入必要的库和数据集。
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix, classification_report
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
2. 将数据集分为训练集和测试集。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
```
3. 创建朴素贝叶斯分类器并进行训练。
```python
clf = GaussianNB()
clf.fit(X_train, y_train)
```
4. 对测试集进行预测并计算混淆矩阵和分类报告。
```python
y_pred = clf.predict(X_test)
cm = confusion_matrix(y_test, y_pred)
cr = classification_report(y_test, y_pred)
print("Confusion Matrix:\n", cm)
print("Classification Report:\n", cr)
```
5. 根据混淆矩阵计算准确率、召回率、查准率和 F1-score 值。
```python
tp = cm[0, 0]
tn = cm[1, 1] + cm[1, 2] + cm[2, 1] + cm[2, 2]
fp = cm[1, 0] + cm[2, 0]
fn = cm[0, 1] + cm[0, 2]
accuracy = (tp + tn) / (tp + tn + fp + fn)
precision = tp / (tp + fp)
recall = tp / (tp + fn)
f1_score = 2 * precision * recall / (precision + recall)
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1_score)
```
以上就是利用 Scam 对 Iris 数据集进行分类并计算相关指标的完整步骤。需要注意的是,朴素贝叶斯分类器是一种概率模型,因此在计算指标时需要将混淆矩阵转化为二分类形式。
阅读全文