python使用paddleocr
时间: 2025-01-03 16:42:52 浏览: 7
### 如何在 Python 中使用 PaddleOCR 进行光学字符识别
为了利用 PaddleOCR 实现高效的光学字符识别 (OCR),开发者可以通过安装库并调用相应的 API 来处理图像文件。下面提供了一种方法来设置环境以及执行 OCR 的具体实例。
#### 安装依赖项
首先,确保环境中已安装必要的软件包。通过 pip 命令可以直接安装最新版本的 `paddleocr` 库:
```bash
pip install paddleocr --upgrade
```
#### 导入模块与初始化引擎
接着,在 Python 脚本中导入所需的类,并创建一个新的 OCR 引擎对象用于后续操作:
```python
from paddleocr import PaddleOCR, draw_ocr
# 创建一个默认配置下的 OCR 对象
ocr = PaddleOCR(use_angle_cls=True, lang='en')
```
这段代码设置了角度分类器 (`use_angle_cls`) 和语言参数 (`lang`) 以便更好地适应特定应用场景的需求[^2]。
#### 执行文字检测和识别
准备好之后就可以加载待分析的目标图片路径,并调用 `ocr.ocr()` 方法来进行实际的文字定位及内容解析工作了:
```python
img_path = 'example_image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
```
上述命令会返回每行文本的位置坐标及其对应的字符串表示形式;其中每一组数据都包含了四个顶点位置信息(矩形框)加上最终被辨识出来的字符序列[^3]。
#### 可视化结果展示
如果想要直观查看识别效果的话,则可借助辅助函数绘制边界框于原始图之上:
```python
import cv2
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
```
此部分代码读取输入图像并将预测得到的信息叠加显示出来保存成新文件名为 "result.jpg"[^1]。
阅读全文