paddle ocr 中函数PaddleOCR()的参数
时间: 2023-12-18 16:03:49 浏览: 320
iOS端 Paddle OCR 移动端文字识别
5星 · 资源好评率100%
PaddleOCR() 函数主要有以下参数:
- image (str/np.ndarray): 待识别的图片路径或者图片数据,支持jpg、png、bmp格式。
- det (str): 检测算法类型,支持 "ch_ppocr_server_v1.1_det_infer"、"ch_ppocr_mobile_v1.1_det_infer"、"ch_ppocr_v2.0_det_infer"、"ch_ppocr_v2.0_server_det_infer"、"ch_ppocr_v2.1_det_infer"、"ch_ppocr_v2.1_server_det_infer"、"ch_ppocr_v2.2_det_infer"、"ch_ppocr_v2.3_det_infer"、"ch_ppocr_v2.4_det_infer"、"ch_ppocr_v2.5_det_infer"。默认为 "ch_ppocr_server_v1.1_det_infer"。
- rec (str): 识别算法类型,支持 "ch_ppocr_server_v1.1_rec_infer"、"ch_ppocr_mobile_v1.1_rec_infer"、"ch_ppocr_v2.0_rec_infer"、"ch_ppocr_v2.0_server_rec_infer"、"ch_ppocr_v2.1_rec_infer"、"ch_ppocr_v2.1_server_rec_infer"、"ch_ppocr_v2.2_rec_infer"、"ch_ppocr_v2.3_rec_infer"、"ch_ppocr_v2.4_rec_infer"、"ch_ppocr_v2.5_rec_infer"。默认为 "ch_ppocr_server_v1.1_rec_infer"。
- cls (str): 分类算法类型,支持 "ch_ppocr_mobile_v1.1_cls_infer"、"ch_ppocr_server_v1.1_cls_infer"、"ch_ppocr_v2.0_cls_infer"、"ch_ppocr_v2.0_server_cls_infer"、"ch_ppocr_v2.1_cls_infer"、"ch_ppocr_v2.1_server_cls_infer"、"ch_ppocr_v2.2_cls_infer"、"ch_ppocr_v2.3_cls_infer"、"ch_ppocr_v2.4_cls_infer"、"ch_ppocr_v2.5_cls_infer"。默认为 "",即不进行分类。
- use_angle_cls (bool): 是否使用文字方向分类模型。默认为 False。
- use_gpu (bool): 是否使用 GPU 进行推理。默认为 False。
- gpu_mem (int): GPU 内存大小。默认为 8000。
- det_model_dir (str): 检测模型所在文件夹的路径。默认为 None,自动下载所需检测模型。
- rec_model_dir (str): 识别模型所在文件夹的路径。默认为 None,自动下载所需识别模型。
- cls_model_dir (str): 分类模型所在文件夹的路径。默认为 None,自动下载所需分类模型。
- use_space_char (bool): 是否将空格加入识别结果中。默认为 True。
- lang (str): 识别语言类型,支持 "ch", "en"。默认为 "ch"。
- use_cn_dict (bool): 是否使用中文词典,用于调整结果。默认为 True。
- cn_dict_path (str): 中文词典文件路径。默认为 None,使用默认词典。
- drop_score (float): 文字检测置信度阈值,低于此阈值的框将被过滤掉。默认为 0.5。
- det_db_thresh (float): 文字检测二值化阈值。默认为 0.3。
- det_db_box_thresh (float): 文字检测框阈值。默认为 0.5。
- det_db_unclip_ratio (float): 文字检测还原框比例。默认为 1.6。
- det_east_score_thresh (float): EAST 检测算法的置信度阈值。默认为 0.8。
- det_east_cover_thresh (float): EAST 检测算法的覆盖率阈值。默认为 0.1。
- det_east_nms_thresh (float): EAST 检测算法的 NMS 阈值。默认为 0.2。
- rec_char_type (str): 识别字符类型,支持 "ch", "en", "digit"。默认为 "ch"。
- rec_image_shape (str): 识别模型输入图片的形状,如 "3, 32, 320"。默认为 "3, 32, 320"。
- rec_batch_num (int): 识别模型每批次输入的数量。默认为 30。
- rec_char_dict_path (str): 识别字符字典文件路径。默认为 None,使用默认的字符字典。
- rec_char_dict (dict): 识别字符字典,以 dict 的形式传入。默认为 None,使用默认字符字典。
- rec_max_len (int): 识别结果的最大长度。默认为 25。
阅读全文