ICPR MTWI 2018挑战赛的cnn_lstm_ctc_ocr项目分叉指南

需积分: 15 35 浏览量更新于2024-12-09 收藏 2.93MB ZIP 举报

它主要涉及的领域是光学字符识别（Optical Character Recognition，OCR），这是一个利用计算机视觉技术实现图像中文字识别的技术领域。在此项目中，特别使用了卷积神经网络（Convolutional Neural Networks，CNN）和长短期记忆网络（Long Short-Term Memory，LSTM）以及连接时序分类（Connectionist Temporal Classification，CTC）技术来提高OCR技术的准确性。描述中提到，用户应该自行准备和剪辑数据集，包括更改数据路径到自己的原始数据，并且说明了如何使用Affine变换将倾斜的图片转换为矩形，以及如何使用getTxt.py脚本来调整标签的方向。此外，数据需要转换成TFRecord格式，这是一种Google开发的用于训练TensorFlow模型的数据格式，通过mjsynth-tfrecord.py脚本可以进行相应的转换。这些步骤为训练和评估OCR模型提供了必要的数据准备过程。该存储库的标签“ocr recognition cnn-lstm-ctc Python”明确指出，此项目涉及到的OCR识别技术、卷积神经网络、长短期记忆网络以及CTC技术，并且编程语言为Python，这是机器学习和深度学习项目常用的开发语言。对于初学者或对该领域感兴趣的研究人员来说，这个项目的代码库是一个很好的学习资源。它不仅展示了如何处理和准备OCR任务的数据，而且还展示了一个基于深度学习的OCR模型的构建过程。此外，项目的贡献者还提到了使用的字典是由英语、中文和数字组成的新word_dictionary，这说明了该项目支持多语言的字符识别任务，是多语言OCR技术的一个实践案例。项目中还包含了一个预训练模型，尽管贡献者表示模型效果并不理想，但它为研究者提供了一个开始点，可以根据自己的数据集进行进一步的训练和优化。"

资源目录

收起资源包目录

ICPR MTWI 2018挑战赛的cnn_lstm_ctc_ocr项目分叉指南（35个子文件）

denseNet.cpython-36.pyc 5KB

1_1.jpg 895B

5.jpg 2KB

result.jpg 18KB

Makefile 631B

mjsynth-tfrecord.py 8KB

word_dict.cpython-36.pyc 16KB

3_3.jpg 1KB

3.jpg 2KB

4.jpg 2KB

2.jpg 2KB

mjsynth.py 8KB

denseNet.py 6KB

2_2.jpg 3KB

LICENSE 34KB

test.py 7KB

mjsynth.cpython-36.pyc 5KB

words-000.tfrecord 1.46MB

checkpoint 289B

getTxt.py 3KB

target_cut.py 5KB

train.py 8KB

model.cpython-36.pyc 5KB

.gitignore 1KB

5_5.jpg 950B

rank_42.png 15KB

validate.py 5KB

README.md 3KB

model.py 8KB

word_dict.py 16KB

words-000.tfrecord 1.59MB

1.jpg 1KB

4_4.jpg 2KB

words-000.tfrecord 1.46MB

AUTHOR 69B

共 35 条

婉君喜欢DIY

粉丝: 18

ICPR MTWI 2018挑战赛的cnn_lstm_ctc_ocr项目分叉指南

ICPR MTWI 2018挑战赛专用的CNN_LSTM_CTC OCR优化源码

深度学习驱动的电影评论情感分析：CNN_LSTM 模型的卓越表现

深度学习模型CNN_LSTM_ATTENTION在寿命预测中的应用

基于CNN_LSTM_CTC的OCR识别ICPR挑战赛优化源码

cnn_lstm_ctc_ocr：基于Tensorflow的CNN + LSTM进行了OTC的CTC损失训练

CNN_LSTM_CTC_Tensorflow：使用Tensorflow实现的基于CNN + LSTM + CTC的OCR

6.cnn-lstm.py_lstmcnn股票_LSTM时间序列_LSTM_lstm预测_lstm-cnn_

keras-master (1).zip_CNN_lstm_cnn+lstm_deep learning_keras

CNN_LSTM_attention.zip

最新资源