手写决策树算法，输出准确率、精度、召回率、F度量值

时间: 2023-10-20 15:18:34 浏览: 86

KNN近邻法进行手写识别的数据（0-9）

KNN（K-Nearest Neighbors，K-最近邻）是一种简单而强大的监督学习算法，常用于分类和回归任务。在这个特定的案例中，我们关注的是利用KNN方法对手写数字进行识别，如标题和描述所示。这个数据集很可能是为了训练一个模型，该模型能够分析手写数字图像，并正确地将它们归类到0到9这10个类别中。我们需要了解KNN的工作原理。在KNN算法中，新样本会被分配到与其最近的K个训练样本中最常见的类别。这里的"最近"通常是根据某种距离度量（如欧氏距离）来定义的。K值的选择对模型性能有很大影响，较小的K值可能导致过拟合，较大的K值可能引入噪声，使模型泛化能力下降。数据集通常包含两个部分：训练集和测试集。在这个例子中，"trainingDigits"可能代表训练数据，其中包括了大量的手写数字图像及其对应的标签。这些图像可能是二维数组，每一维表示图像的一个像素，数值范围通常在0到255之间，代表灰度级别。训练集的目的是让模型学习不同数字的特征。在处理图像数据时，我们通常需要进行预处理步骤，例如调整图像大小，归一化像素值，甚至进行一些降维操作，如PCA（主成分分析），以减少计算复杂性和提高效率。对于手写数字识别，还可能包括直方图均衡化来增强图像对比度。接下来，我们可以使用各种方法来实现KNN算法，如基于Python的scikit-learn库。在scikit-learn中，我们首先将数据集分为特征（X）和目标变量（y），然后创建KNN分类器实例并设置K值。接着，使用训练数据拟合模型，最后用测试数据进行预测，评估模型的性能，比如通过准确率、精确率、召回率或F1分数。对于手写数字识别，一种常见的评估方法是交叉验证，例如k折交叉验证，其中数据被分成k个子集，每次用k-1个子集训练模型，剩下的子集用于验证，重复k次，确保每个子集都作为验证集一次。这样可以得到更稳定的模型性能估计。总结来说，KNN近邻法是一种非参数机器学习算法，适用于手写数字识别任务。这个数据集"trainingDigits"可能包含数千张手写数字图像，可用于训练一个KNN模型来识别人工书写的0到9的数字。处理图像数据、选择合适的K值、模型训练与评估都是这一过程中的关键步骤。通过不断优化和调整，我们可以构建出一个高精度的手写数字识别系统。

好的，以下是手写决策树算法的代码： ```python import pandas as pd import numpy as np def calc_entropy(x): """ 计算熵 """ unique, counts = np.unique(x, return_counts=True) p = counts / len(x) return -np.sum(p * np.log2(p)) def calc_info_gain(x, y): """ 计算信息增益 """ base_entropy = calc_entropy(y) unique, counts = np.unique(x, return_counts=True) p = counts / len(x) condition_entropy = np.sum(p * np.array([calc_entropy(y[x == v]) for v in unique])) return base_entropy - condition_entropy def build_tree(x, y, feature_names): """ 构建决策树 """ if len(set(y)) == 1: return y[0] if len(feature_names) == 0: return np.bincount(y).argmax() info_gains = np.array([calc_info_gain(x[:, i], y) for i in range(x.shape[1])]) best_feature_index = np.argmax(info_gains) best_feature_name = feature_names[best_feature_index] tree = {best_feature_name: {}} for v in np.unique(x[:, best_feature_index]): mask = x[:, best_feature_index] == v sub_x = x[mask, :] sub_y = y[mask] sub_feature_names = feature_names[:best_feature_index] + feature_names[best_feature_index + 1:] tree[best_feature_name][v] = build_tree(sub_x, sub_y, sub_feature_names) return tree def predict(x, tree): """ 预测 """ if isinstance(tree, np.int64): return tree feature_name = list(tree.keys())[0] feature_index = feature_names.index(feature_name) value = x[feature_index] if value not in tree[feature_name]: value = list(tree[feature_name].keys())[0] sub_tree = tree[feature_name][value] return predict(x, sub_tree) def accuracy(y_true, y_pred): """ 准确率 """ return np.mean(y_true == y_pred) def precision(y_true, y_pred): """ 精度 """ tp = np.sum((y_true == 1) & (y_pred == 1)) fp = np.sum((y_true == 0) & (y_pred == 1)) return tp / (tp + fp) def recall(y_true, y_pred): """ 召回率 """ tp = np.sum((y_true == 1) & (y_pred == 1)) fn = np.sum((y_true == 1) & (y_pred == 0)) return tp / (tp + fn) def f_measure(y_true, y_pred): """ F度量值 """ p = precision(y_true, y_pred) r = recall(y_true, y_pred) return 2 * p * r / (p + r) # 示例数据 data = pd.DataFrame({ 'age': [18, 23, 25, 30, 35, 40, 50, 55, 60], 'income': [15000, 18000, 20000, 28000, 32000, 35000, 40000, 42000, 45000], 'student': [0, 1, 1, 0, 1, 0, 0, 1, 0], 'credit_rating': [0, 0, 1, 1, 0, 0, 1, 1, 0], 'buy': [0, 0, 1, 1, 1, 0, 1, 1, 1] }) x = data.iloc[:, :-1].values y = data.iloc[:, -1].values feature_names = list(data.columns[:-1]) tree = build_tree(x, y, feature_names) y_pred = np.array([predict(x[i], tree) for i in range(x.shape[0])]) y_true = y # 输出准确率、精度、召回率、F度量值 print('准确率：', accuracy(y_true, y_pred)) print('精度：', precision(y_true, y_pred)) print('召回率：', recall(y_true, y_pred)) print('F度量值：', f_measure(y_true, y_pred)) ``` 运行结果如下： ``` 准确率： 1.0 精度： 1.0 召回率： 1.0 F度量值： 1.0 ``` 可以看到，准确率、精度、召回率和F度量值都是1，说明手写的决策树算法在这个数据集上表现得很好。

阅读全文

手写决策树算法，输出准确率、精度、召回率、F度量值

相关推荐

手写数字识别教程：KNN算法实现与数据集分析

MATLAB K-近邻算法识别MNIST手写体数据集教程

手写决策树算法，实现准确率、精度、召回率、F度量值

手写决策树算法，实现准确率、精度、召回率、F度量值的实现

KNN算法实现手写数字识别

kNN分类算法手写识别数据集

基于Python实现手写数字识别的KNN算法实例

基于knn算法对minist手写数据集的分类

KNN算法--手写数字识别代码实现.zip

利用k-近邻算法实现手写体分类代码及数据集

代码及数据集：KNN分类算法--手写数字识别任务

KNN算法改进约会网站的配对效果和实现手写数字识别.zip

使用K-近邻算法在MATLAB中识别MNIST手写数字

图像识别的决策树算法：挑战与对策的深度剖析

KNN算法的距离度量：不同距离度量对算法性能的影响，选择最优距离度量

手写数字识别模型的解释性：理解模型决策过程

基于knn算法的手写识别

knn算法实现手写数字识别

手写数字识别技术：最近邻域法的应用与实现

最新推荐

【java毕业设计】网页时装购物系统源码（springboot+vue+mysql+说明文档+LW）.zip

Kylin10 + GDAL2.4 + OSG3.6.4 + OsgEarth2.10.1

计算机系统维护技术.xps

数学建模问题中阻滞增长模型

基于Java的菜匣子优选系统设计与实现+jsp（源码）.rar

Angular实现MarcHayek简历展示应用教程

管理建模和仿真的文件

深入剖析：内存溢出背后的原因、预防及应急策略（专家版）

Java中如何对年月日时分秒的日期字符串作如下处理：如何日期分钟介于两个相连的半点之间，就将分钟数调整为前半点

Crossbow Spot最新更新 - 获取Chrome扩展新闻