paddleocr函数参数详解
时间: 2024-06-18 12:02:19 浏览: 240
PaddleOCR是一个基于PaddlePaddle深度学习框架的OCR工具,可以用于文字检测、文字识别等任务。以下是PaddleOCR中几个常用函数的参数详解:
1. detect_text
- image: 待检测的图片,可以是numpy数组或者图片文件路径
- cls_model: 文字检测的模型,默认为DBNet,也可以是EAST或者SAST
- det_db_thresh: DBNet模型中,文本检测的二值化阈值,默认为0.3
- det_db_box_thresh: DBNet模型中,NMS筛选框的阈值,默认为0.5
- det_db_unclip_ratio: DBNet模型中,文本框大小的缩放比例,默认为2.0
- det_east_score_thresh: EAST模型中,文本检测的二值化阈值,默认为0.8
- det_east_cover_thresh: EAST模型中,NMS筛选框的阈值,默认为0.1
- det_sast_score_thresh: SAST模型中,文本检测的二值化阈值,默认为0.5
- det_sast_nms_thresh: SAST模型中,NMS筛选框的阈值,默认为0.2
2. recognition
- image: 待识别的图片,可以是numpy数组或者图片文件路径
- model: 文字识别的模型,默认为CRNN,也可以是Rosetta或者STAR-Net
- use_gpu: 是否使用GPU,默认为True
- rec_char_type: 文字识别的字符集类型,默认为ch,也可以是en或者digit
- max_text_length: 文字识别的最大长度,默认为25
- rec_image_shape: 文字识别网络输入图片的大小,默认为(3, 32, 320)
3. inference_ocr
- image_file: 待识别的图片文件路径
- det_model_dir: 文字检测模型的路径
- rec_model_dir: 文字识别模型的路径
- use_angle_cls: 是否使用角度分类,默认为True
- use_gpu: 是否使用GPU,默认为True
阅读全文