https://github.com/parrot-office/tesseract 已经无效了
时间: 2023-08-21 22:08:32 浏览: 213
非常抱歉,我的回答已经过时了。您是正确的,https://github.com/parrot-office/tesseract 这个项目已经不再维护了。如果您需要使用 Tesseract OCR 引擎,可以从以下渠道获取:
1. 从 Tesseract OCR 的官方代码库下载源代码,并自行编译为可执行文件。编译 Tesseract OCR 需要一定的编程和系统知识,如果您不熟悉这些内容,可能会比较困难。
2. 从第三方网站下载预编译的 Tesseract OCR 可执行文件。请注意,从第三方网站下载的文件可能存在安全风险,建议仔细核实文件来源和完整性。以下是一些可能有用的网站:
- https://github.com/UB-Mannheim/tesseract/wiki - 该网站提供了 Windows 和 Linux 下的安装包和便携版。
- https://digi.bib.uni-mannheim.de/tesseract/ - 该网站提供了 Tesseract OCR 的 Windows 和 Linux 下的便携版,包括最新版本和旧版本。
- https://sourceforge.net/projects/tesseract-ocr-alt/files/ - 该网站提供了 Tesseract OCR 的一些旧版本可执行文件的下载。
请注意,使用 Tesseract OCR 引擎进行 OCR 识别时,需要使用相应的语言训练数据文件才能获得更好的识别效果。您可以从 Tesseract OCR 官网(https://github.com/tesseract-ocr/tessdata)下载所需的语言训练数据文件,将其放到 Tesseract OCR 引擎的 `tessdata` 目录下即可。例如,如果您需要识别中文简体文字,可以下载 `chi_sim.traineddata` 文件,并将其放到 `tessdata` 目录下。
阅读全文