Tensorflow与Keras实现端到端中文字符检测与识别系统

版权申诉

140 浏览量更新于2024-11-13 1 收藏 89.41MB ZIP 举报

资源摘要信息:《基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别》毕业设计项目通过使用深度学习框架Tensorflow和其高级API Keras，实现了对不定长中文字符进行检测和识别的端到端解决方案。项目中涉及的关键技术和算法包括CTPN（Connectionist Text Proposal Network）用于文本检测，以及DenseNet（Densely Connected Convolutional Networks）与CTC（Connectionist Temporal Classification）结合用于文本识别。项目概述: 1. 文本检测技术：CTPN是一种基于深度学习的文本检测算法，它能够直接从图像中提取文本区域，无需预先设定文本候选窗口。CTPN利用卷积神经网络（CNN）来逐像素地预测文本行，通过连接性分析来确定文本区域的精确位置。CTPN特别适合于检测汉字这样的复杂字符，并且在文本行检测方面表现优异。 2. 文本识别技术：DenseNet和CTC的结合使用是一种先进的端到端字符识别方法。DenseNet通过其密集连接的块结构使得每一层网络都与其它层直接相连，从而实现特征的重用和网络信息流的优化。CTC是一种序列建模方法，适用于处理不定长的输入输出问题，特别适合于处理文字识别任务中字符的不确定长度。CTC能够将字符序列的对齐问题转化为一个优化问题，并且在训练过程中不需要事先对齐标签。环境部署: 项目环境部署是通过执行一个名为“setup.sh”的脚本来完成的。这个脚本主要负责安装项目运行所需的依赖库和环境配置。需要注意的是，在CPU环境下运行前，需要注释掉脚本中针对GPU的部分，并解开CPU部分的注释。这说明了项目的部署需要依赖于GPU硬件加速来提升训练和识别的效率，但同时也提供了在CPU环境下的运行选项。 Demo: 为了演示项目的功能，作者提供了一个简单的演示程序。用户需要将测试图片放置到“test_images”目录下，运行“demo.py”脚本后，检测结果将保存在“test_result”目录中。这个Demo可以让用户直观地体验到模型对中文字符的检测和识别能力。模型训练: 项目的训练部分分为CTPN训练和DenseNet + CTC训练两个部分。 - CTPN训练: 训练过程中使用的是CTPN网络结构，详细步骤和说明请参见项目中“ctpn”文件夹下的“README.md”。 - DenseNet + CTC训练: 需要进行数据准备，数据集包含约364万张图片，这些图片被划分为训练集和验证集。数据集的构建使用了中文语料库（包括新闻和文言文）来生成数据，通过对字体、大小、灰度、模糊、透视和拉伸等方式的随机变换增加数据多样性。数据集包含汉字、英文字母、数字和标点共5990个字符。每个样本包含10个随机字符，图片分辨率为280x32。图片解压后应放置在“train/images”目录下，而描述文件则放置在“train”目录下。标签信息: 毕业设计、Java源码、中文字符识别是本项目的三个重要标签。项目作为一个毕业设计，可能涉及到一些Java编程工作，但主要的深度学习模型和算法实现还是基于Tensorflow和Keras。项目专注于中文字符的识别，是计算机视觉与自然语言处理交叉领域的应用实例。文件名称列表信息: 文件列表中包含“分享说明.txt”和“chinese_ocr-master”。其中，“分享说明.txt”可能包含了该项目的使用说明、版权声明或是其他重要信息。而“chinese_ocr-master”表明这是一套完整的中文OCR（Optical Character Recognition，光学字符识别）系统或解决方案的主分支代码，该项目是该项目的主目录，包含了项目的全部资源文件。以上总结的知识点详细介绍了项目的背景、所使用的关键技术和算法、环境部署和运行方式、Demo演示以及模型训练的具体步骤和数据准备细节。通过这些信息，可以全面了解该项目的实现细节和操作方法。

收起资源包目录

【毕业设计】基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别.zip （105个子文件）

text_connect_cfg.py 381B

model.py 2KB

timer.py 552B

factory.py 467B

demo.py 4KB

other.py 1KB

text_proposal_connector_oriented.py 4KB

__init__.py 86B

006.jpg 273KB

__init__.py 0B

010.png 67KB

setup_cpu.py 2KB

001.jpg 157KB

pascal_voc.py 10KB

bbox.c 319KB

VGGnet_fast_rcnn_iter_50000.ckpt.data-00000-of-00001 68.26MB

gpu_nms.hpp 146B

train.py 9KB

setup.py 4KB

VGGnet_test.py 2KB

ocr.py 3KB

__init__.py 24B

__init__.py 19B

minibatch.py 8KB

densenet.py 3KB

gpu_nms.pyx 1KB

proposal_layer_tf.py 7KB

roidb.py 6KB

imdb.py 5KB

007.jpg 77KB

gpu_nms.cpp 285KB

checkpoint 121B

weights_densenet.h5 18.92MB

003.jpg 270KB

blob.py 1KB

test.py 2KB

VGGnet_fast_rcnn_iter_50000.ckpt.meta 634KB

007_oriented.jpg 160KB

008.jpg 164KB

cython_nms.pyx 4KB

ds_utils.py 1KB

text_proposal_connector.py 2KB

demo_detect.jpg 400KB

002.jpg 259KB

bbox.pyx 3KB

VGGnet_fast_rcnn_iter_50000.ckpt.index 2KB

README.md 2KB

bbox_transform.py 3KB

003.jpg 174KB

train_net.py 1KB

keys.py 17KB

VGG_imagenet.npy 0B

ToVoc.py 7KB

008.jpg 121KB

VGGnet_train.py 3KB

__init__.py 98B

.gitignore 148B

010.png 13KB

detectors.py 2KB

text_proposal_graph_builder.py 3KB

factory.py 841B

densenet.py 3KB

008_oriented.jpg 170KB

cython_nms.c 358KB

007.jpg 153KB

split_label.py 4KB

.gitkeep 0B

004.jpg 1.04MB

setup.sh 356B

LICENSE 11KB

nms_wrapper.py 435B

__init__.py 0B

text_detect.py 3KB

__init__.py 172B

001.jpg 1.26MB

004.jpg 259KB

config.py 10KB

demo.jpg 1.06MB

005.jpg 382KB

boxes_grid.py 3KB

make.sh 134B

__init__.py 73B

009.jpg 354KB

gpu_nms.c 285KB

anchor_target_layer_tf.py 13KB

generate_anchors.py 1KB

network.py 18KB

demo.py 816B

002.jpg 22KB

demo_rec.jpg 144KB

__init__.py 554B

005.jpg 691KB

nms_kernel.cu 5KB

.gitkeep 0B

train.py 6KB

README.md 4KB

layer.py 3KB

006.jpg 460KB

__init__.py 0B

009.jpg 238KB

共 105 条

小正太浩二

粉丝: 334
资源: 5942

Tensorflow与Keras实现端到端中文字符检测与识别系统

人工智能课程设计基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别源码+文本检测数据集.zip

毕业设计基于cc和Keras实现端到端的不定长中文字符检测和识别.zip

python基于tensorflow、keraspytorch实现对自然场景的文字检测及端到端的OCR中文文字识别.zip

基于Tensorflow和Keras的中文字符检测与识别系统

基于tensorflow、keraspytorch框架实现图片文字检测及端到端的OCR文字识别.zip

pytorch、TensorFlow、深度学习实现基于EAST自然文本检测系统.zip

tkinter+cv2+tensorflow车牌识别软件.zip

基于MATLAB的车牌识别系统的研究与实现.zip

基于深度学习LPR算法高性能国内中文车牌识别C和C++源码(可部署到嵌入式移动端)+使用说明.zip

chinese_ocr-master.zip

最新资源