paddleocrc
时间: 2023-09-24 18:10:41 浏览: 71
paddleocr模型文件
PaddleOCR是一个功能强大的OCR工具包,用于富文本检测、文本识别和端到端算法。它采用了DB和CRNN作为基本的检测和识别模型,并通过一系列优化策略形成了一系列模型,称为PP-OCR,用于工业应用。
为了方便用户使用,PaddleOCR还提供了PP-Structure工具包,包括布局分析和表格识别两大任务,以满足文档场景任务的需求。
如果您想在Python环境中使用PaddleOCR,您需要按照以下步骤进行设置和安装:
1. 安装PaddlePaddle 2.0。如果您的机器上已经安装了cuda9或cuda10,可以使用以下命令安装GPU版本:
python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
如果您的计算机没有可用的GPU,可以使用以下命令安装CPU版本:
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
2. 编写代码并进行测试。可以使用以下代码作为参考:
```
from PIL import Image
from paddleocr import PaddleOCR
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, use_gpu=False, lang="ch")
img_path = './myImgs/001.jpg' # 图片路径
result = ocr.ocr(img_path, cls=True) # 进行文本识别
for line in result:
print(line)
image = Image.open(img_path).convert('RGB')
boxes = [line for line in result]
txts = [line for line in result]
scores = [line for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
```
阅读全文