Tesseract安装
时间: 2024-10-12 21:02:02 浏览: 35
Tesseract OCR是一款广泛用于光学字符识别(OCR)的开源软件。要在Python中使用`pytesseract`库,你需要先安装Tesseract。下面是Windows、Mac OS和Linux上安装Tesseract的基本步骤:
### Windows:
1. 访问[Tesseract官网](https://github.com/tesseract-ocr/tesseract)下载最新稳定版的Windows ZIP包。
2. 解压到你喜欢的位置,例如`C:\Program Files\Tesseract-OCR`。
3. 添加Tesseract的bin目录(通常是`C:\Program Files\Tesseract-OCR\tesseract.exe`)到系统环境变量的Path中。
### Mac OS (Homebrew):
1. 首先安装Homebrew:`/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/main/install.sh)"`
2. 使用Homebrew安装Tesseract:`brew install tesseract`.
3. 系统会自动将Tesseract添加到`/usr/local/bin`,无需额外配置环境变量。
### Linux (Ubuntu/Debian):
1. 打开终端并运行:`sudo apt-get update && sudo apt-get install tesseract-ocr` 或者 `sudo yum install tesseract-ocr`(取决于你的发行版)。
2. 安装完成后,Tesseract通常会在`/usr/bin`目录下。
### Python安装:
安装好Tesseract之后,在Python中安装`pytesseract`:
```bash
pip install pytesseract pillow
```
确保`pytesseract`能正确找到Tesseract,如果仍报错,可能需要手动指定Tesseract的完整路径,例如:
```python
import os
os.environ["PYTesseract"] = r'/path/to/tesseract'
```
现在应该可以正常使用Tesseract了。如有更多疑问,可以查看`pytesseract`的官方文档。
阅读全文