tesseract-recognize工具：布局分析与文本识别的新方法

需积分: 44 46 浏览量更新于2024-11-08 收藏 26KB ZIP 举报

tesseract是一个开源的光学字符识别引擎，广泛应用于图像中文字的识别。tesseract-recognize在此基础上进行扩展，提供了布局分析和文本识别的功能，并且能够将识别结果以Page XML格式进行输出。 tesseract-recognize的使用需要满足一定的环境要求。在Ubuntu 18.04和20.04上，需要安装cmake、g++、libtesseract-dev、libgs-dev、libxslt1-dev和libopencv开发等软件包。其中，libtesseract-dev是tesseract的开发包，libgs-dev是GNU Ghostscript的开发包，libxslt1-dev是libxslt1的开发包，libopencv开发是OpenCV的开发包。在安装完所需的软件包后，可以通过Tesseract-ocr、幽灵脚本、libxslt1.1、libopencv-core3.2或libopencv-core4.2等工具运行tesseract-recognize。如果想从源代码进行编译，可以按照提供的操作进行。如果只是想简单使用该工具，可以选择使用docker，具体操作在文档中有详细的说明。 tesseract-recognize的源代码可以通过git clone命令从github上获取，并且需要使用--recursive参数以获取子模块。获取源代码后，需要创建一个名为tesseract-recognize的目录，并在此目录中进行后续操作。" 知识点1：tesseract-ocr的介绍和应用 tesseract-ocr是一个开源的光学字符识别引擎，它可以识别图像中的文字并将其转换为机器编码的文字。它可以处理多种类型的图像格式，如JPEG、PNG、BMP等，并支持多种语言的文字识别。tesseract-ocr广泛应用于图像文字的提取、文档数字化、自动录入系统等领域。知识点2：tesseract-recognize的功能和特点 tesseract-recognize是在tesseract的基础上开发的，除了具有tesseract的基本功能外，还增加了布局分析和文本识别的功能，并且能够以Page XML格式输出识别结果。Page XML是一种用于描述文档图像中元素位置和结构的格式，广泛应用于文档图像分析和识别领域。知识点3：tesseract-recognize的运行环境配置在Ubuntu 18.04和20.04上，运行tesseract-recognize需要安装cmake、g++、libtesseract-dev、libgs-dev、libxslt1-dev和libopencv开发等软件包。这些软件包都是tesseract-recognize运行的必要条件，缺一不可。其中，libtesseract-dev、libgs-dev、libxslt1-dev是用于支持tesseract、Ghostscript和XML解析的相关功能，libopencv开发是用于支持图像处理的相关功能。知识点4：tesseract-recognize的安装和运行 tesseract-recognize提供了从源代码编译和使用docker两种安装方式。如果选择从源代码编译，需要按照操作说明进行。如果选择使用docker，操作会相对简单一些。在安装完成后，可以通过Tesseract-ocr、幽灵脚本、libxslt1.1、libopencv-core3.2或libopencv-core4.2等工具运行tesseract-recognize。知识点5：tesseract-recognize的源代码获取和编译 tesseract-recognize的源代码可以通过git clone命令从github上获取。需要注意的是，获取源代码时需要使用--recursive参数以获取子模块。获取源代码后，需要创建一个名为tesseract-recognize的目录，并在此目录中进行后续操作。获取源代码后，需要按照操作说明进行编译和安装。

资源目录

收起资源包目录

tesseract-recognize工具：布局分析与文本识别的新方法（19个子文件）

README.md 6KB

.dockerignore 94B

Dockerfile_ubuntu18.04-github-master 3KB

CMakeLists.txt 2KB

Dockerfile_ubuntu18.04-pkg-langs 441B

Dockerfile_ubuntu16.04-pkg 1KB

.gitmodules 184B

.gitignore 75B

tesseract-recognize.cc 35KB

Dockerfile_ubuntu-langs 261B

githook-pre-commit 2KB

.bumpversion.cfg 136B

PageXML.h 21B

Dockerfile_ubuntu18.04-pkg 1KB

PageXML.cc 22B

Dockerfile_ubuntu18.04-pkg 2KB

Dockerfile_ubuntu16.04-github-master 3KB

tesseract_recognize_api.py 12KB

LICENSE.md 1KB

共 19 条

优创品牌营销

粉丝: 16

tesseract-recognize工具：布局分析与文本识别的新方法

讯飞语音听写二次封装

tesseract使用结果分析

java-tesseract-ocr:使用tesseract读取图像中的文本

JavaCPP-Tesseract-Example:使用 BuffereImage 的 tesseract 示例

nodejs-tesseract-experiences:使用 node.js + Tesseract 的经验

react-native-tesseract-ocr:Tesseract-OCR的React型包装纸

tesseract-bot:Telegram机器人使用Google的Tesseract解析文本图像

tesseract-serbian:一组数据文件，可用于训练 tesseract-ocr 识别塞尔维亚西里尔字母。 一组用于使 tesseract-ocr 程序识别塞尔维亚西里尔字母的文件

marshmallow-tesseract-trainer:tesseract 培训师 gui

Simple-guide2tesseract-ocr:通过动手实例向初学者使用tesseract-ocr的简单易懂指南

最新资源

tesseract-serbian:一组数据文件，可用于训练 tesseract-ocr 识别塞尔维亚西里尔字母。一组用于使 tesseract-ocr 程序识别塞尔维亚西里尔字母的文件