![](https://csdnimg.cn/release/download_crawler_static/86300250/bg5.jpg)
2018/10/24 CVer
https://mp.weixin.qq.com/s/Q7yOF3cNIjgvZMbjvA-ptg 5/23
确保安装了 Tesseract 以后,你应该执行以下命令验证 Tesseract 版本:
windows环境安装tesseract-ocr 4.00并配置环境
第一步:下载安装包
根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安装包,好像我只看到64位的安装包
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记
得你的安装目录,我们等会配置环境变量要用。
如果不是做英文的图文识别,还需要下载其他语言的识别包https://github.com/tesseract-ocr/tesseract/wiki/
Data-Files。
简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata
繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata
第二步:安装
直接执行下载好的tesseract-ocr-setup-4.00.00dev.exe,下一步、下一步安装。
第三步:配置环境变量
注意:我的系统是win7,其他系统应该差不多,跟配置java变量一样
复制你的安装地址,我的是安装在C:\Program Files (x86)\Tesseract-OCR
安装 Tesseract + Python 捆绑
安装好 Tesseract 库之后,我们需要安装 Tesseract + Python 捆绑,这样我们的 Python 脚本就
可以与 Tesseract 通信,并对 OpenCV 处理过的图像执行 OCR。
如果你使用的 是 Python 虚拟环 境(非常推荐,你可以拥有独立的 Python 环境 ),那么使用
workon 命令访问虚拟环境:
如上所示,我访问了一个叫做 cv 的 Python 虚拟环境(cv 是「计算机视觉」的缩写),你也可以
用其他名字命名虚拟环境。
接 下 来 , 我 们 将 使 用 pip 来 安 装 Pillow ( PIL 的 Python 版 本 ) , 然 后 安 装 pytesseract 和
imutils:
现在打开 Python shell,确认你导入了 OpenCV 和 pytesseract: