liux下安装Tesseract-OCR
时间: 2024-06-21 07:00:45 浏览: 218
在Linux系统上安装Tesseract OCR(开源光学字符识别引擎)通常分为几个步骤,这里以Ubuntu或Debian为基础进行说明:
1. **更新包列表并安装依赖**:
```bash
sudo apt-get update
sudo apt-get install build-essential libtesseract-dev libprotobuf-dev protobuf-compiler
```
2. **下载源码** (如果Tesseract的最新稳定版不在包管理器中):
```bash
wget https://github.com/tesseract-ocr/tesseract/archive/v4.2.0.zip
unzip v4.2.0.zip
```
3. **编译安装**:
进入解压后的目录,例如`tesseract-4.2.0`:
```bash
cd tesseract-4.2.0
./autogen.sh
./configure --prefix=/usr/local
make
sudo make install
```
4. **添加环境变量**:
在`~/.bashrc`或`~/.profile`中追加:
```bash
export PATH=$PATH:/usr/local/bin
```
5. **测试安装**:
```bash
tesseract --version
```
6. **(可选)语言包安装**:
如果你需要特定的语言支持,可以通过Tesseract的命令行工具安装,例如安装英文包:
```bash
sudo tesseract --tessdata-dir=/usr/local/share/tesseract-ocr langcodes
```
7. **设置环境变量**:
刷新环境变量使更改生效,然后退出重新登录或者运行:
```bash
source ~/.bashrc
```
阅读全文