paddleocr 的result = ocr.ocr(str(img_path)),中result格式是什么
时间: 2023-11-04 18:04:42 浏览: 130
OCR.rar_OCR.DLL_c# ocr_c# 文字识别_ocr 文字识别_文字识别
`paddleocr` 的 `ocr()` 函数返回一个包含识别结果的列表,每个识别结果都是一个字典,表示一个文本行。每个文本行字典包含以下字段:
- `text`: 文本行识别结果,字符串类型。
- `confidence`: 文本行识别置信度,float 类型。
- `text_region`: 文本行在原图中的位置和大小,格式为 `(x1, y1, x2, y2, x3, y3, x4, y4)`,表示文本行外接四边形的四个顶点坐标(x, y)。其中,(x1, y1) 表示左上角的点,(x2, y2) 表示右上角的点,(x3, y3) 表示右下角的点,(x4, y4) 表示左下角的点。
- `char_info`: 文本行中每个字符在原图中的位置和大小以及识别结果和置信度。`char_info` 是一个列表,每个元素都是一个字典,表示一个字符。每个字符字典包含以下字段:
- `text`: 字符识别结果,字符串类型。
- `confidence`: 字符识别置信度,float 类型。
- `text_region`: 字符在原图中的位置和大小,格式为 `(x1, y1, x2, y2, x3, y3, x4, y4)`,表示字符外接四边形的四个顶点坐标(x, y)。其中,(x1, y1) 表示左上角的点,(x2, y2) 表示右上角的点,(x3, y3) 表示右下角的点,(x4, y4) 表示左下角的点。
例如,假设 `result` 是 `paddleocr` 识别图像的结果列表,那么可以通过以下代码访问第一行文本识别结果和识别置信度:
```python
text = result[0]['text']
confidence = result[0]['confidence']
```
可以通过以下代码访问第一行文本在原图中的位置和大小:
```python
text_region = result[0]['text_region']
```
可以通过以下代码访问第一行文本中第一个字符的识别结果和置信度:
```python
char_text = result[0]['char_info'][0]['text']
char_confidence = result[0]['char_info'][0]['confidence']
```
阅读全文