python ocr 机器学习
时间: 2023-08-21 13:18:25 浏览: 133
使用Python进行OCR(光学字符识别)可以借助一些库和工具来实现。其中,cnocr和pytesseract是两个常用的库。
cnocr是一个基于深度学习的中文OCR库,可以用于识别中文字符。使用cnocr进行OCR的代码示例如下:
```python
from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('test.png')
print("Predicted Chars:", res)
```
这段代码使用cnocr库加载模型,并对名为test.png的图片进行OCR识别,然后打印出识别结果。
另一个常用的OCR库是pytesseract,它是Tesseract OCR的Python接口。使用pytesseract进行OCR的代码示例如下:
```python
import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open("D:\\test.png"), lang="eng")
print(text)
```
这段代码使用pytesseract库将名为test.png的图片转换为文本,并打印出识别结果。如果你想尝试识别中文,只需将代码中的lang参数改为"chi_sim"即可。
在使用pytesseract之前,你需要先安装Tesseract OCR和Pillow库。你可以使用pip命令来安装pytesseract和Pillow:
```
pip install pytesseract
pip install pillow
```
另外,你还需要下载并安装Tesseract OCR引擎,并将其路径配置到pytesseract中。以上代码示例中的`tesseract_cmd`变量就是用来指定Tesseract OCR引擎的路径。
希望这些信息对你有帮助!
#### 引用[.reference_title]
- *1* *2* *3* [python之OCR文字识别](https://blog.csdn.net/wu_zhiyuan/article/details/125412990)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文