首页vision transformer处理excel二分类

vision transformer处理excel二分类

时间: 2023-10-14 22:05:29 浏览: 179

基于 Vision Transformer 网络对人脸4种表情识别分类、数据集+代码+训练结果

1.网络使用的是Transformer 网络中的 ViT 模型 2.数据集是4种表情识别（生气、开心、伤心、无表情） 3.网络训练的过程中，预处理处理包括随机裁剪、中心裁剪等等。网络初始化会自动载入ViT 官方的预训练权重(transformer网络收敛很慢，不经过预训练效果会很差，因此本篇代码自动载入） 4.train.py 会自动生成数据集类别的 json 文件，所以不需要自己定义。train.py 训练完成会生成训练集的loss、测试集的loss，训练集的accuracy、测试集的accuracy，并生成对应的曲线保存至run_results文件内。训练完成会计算训练集和测试集的混淆矩阵，计算召回率、特异度、F1等等 5.预测代码是predict.py，只需要将待预测的图像放在inference文件夹下，代码会自动将该文件下所有的图像进行预测，并在原图像左上角写入最大的前三个类别和概率【如果想要训练自己的数据集，参考README文件】【本项目测试了20个epoch，准确率为0.78，网络未收敛，加大轮次可以增加精度】

Vision Transformer (ViT) 是一种用于计算机视觉任务的深度学习模型，主要用于图像分类、目标检测等任务。而 Excel 文件是一种电子表格文件格式，通常不是计算机视觉任务的输入数据格式。因此，将 ViT 用于处理 Excel 二分类任务可能并不是最优的选择。对于 Excel 二分类任务，可以考虑使用传统的机器学习算法，如支持向量机（SVM）、随机森林（Random Forest）等，或者使用基于深度学习的模型，如循环神经网络（RNN）、卷积神经网络（CNN）等。具体选择哪种算法，需要根据数据集的规模、特征等因素进行考虑。

阅读全文