tesseract oem
时间: 2023-10-27 17:07:55 浏览: 48
Tesseract OCR(Optical Character Recognition)的 oem(OCR Engine Mode)参数用于选择不同的OCR引擎模式。Tesseract支持以下四种oem模式:
- 0: Legacy Tesseract OCR Engine
- 1: Neural nets LSTM engine only
- 2: Legacy + LSTM engines
- 3: Default, based on what is available
每个oem模式都有不同的特点和性能,你可以根据你的需求选择合适的模式来进行OCR识别。
相关问题
Tesseract OCR 引擎下载教程
Tesseract OCR 是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别包括中文在内的多种语言。以下是Tesseract OCR引擎的下载教程。
1. 访问Tesseract OCR官方网站:https://github.com/tesseract-ocr/tesseract
2. 点击"Release"标签,进入发布页面。
3. 下载最新版本的Tesseract OCR引擎,如tesseract-4.1.1.tar.gz。
4. 解压下载的文件。
5. 打开终端,进入解压后的目录。
6. 安装Tesseract OCR引擎,输入以下命令:
```
./autogen.sh
./configure
make
sudo make install
```
7. 安装完成后,输入以下命令来测试Tesseract OCR引擎是否安装成功:
```
tesseract imagename outputbase [-l lang] [--psm pagesegmode] [--oem ocrengine]
```
其中,imagename为需要识别的图片路径,outputbase为输出文件的路径和名称,lang为语言选项,pagesegmode为页面分割模式,ocrengine为OCR引擎选项。
以上就是Tesseract OCR引擎的下载安装教程。
qt如何使用编译好的tesseract库
要在Qt中使用编译好的Tesseract库,需要进行以下步骤:
1. 将编译好的Tesseract库文件(.dll或.so文件)和头文件(.h文件)复制到Qt项目的文件夹中。
2. 在Qt项目的.pro文件中添加以下代码:
```
INCLUDEPATH += path/to/tesseract/headers
LIBS += -Lpath/to/tesseract/libraries -ltesseract
```
其中,path/to/tesseract/headers和path/to/tesseract/libraries需要替换为实际的路径。
3. 在Qt项目的代码中包含Tesseract头文件,并调用Tesseract函数进行OCR操作。例如:
```
#include <tesseract/baseapi.h>
// ...
tesseract::TessBaseAPI* api = new tesseract::TessBaseAPI();
api->Init(NULL, "eng", tesseract::OEM_DEFAULT);
api->SetImage(image);
char* outText = api->GetUTF8Text();
```
这样就可以使用编译好的Tesseract库进行OCR操作了。