paddleocr识别字典
时间: 2023-11-06 08:05:05 浏览: 335
WSCDDL.rar_字典_字典学习_弱监督_视觉_视觉识别
paddleocr识别字典是一个用于将文字映射为索引的字典文件。默认的字典文件是ppocr_keys_v1.txt,其中包含了6000多个字符。然而,有些字符识别效果可能并不理想。因此,你可以根据需要选择一些字符,并以同样的格式保存在一个txt文件中,将该文件作为字典文件来使用。为了方便生成训练图片,你可以只选择60个字符。需要注意的是,在配置文件中将字典文件的名称更改为你保存的txt文件名。此外,为了使这个修改生效,你还需要在paddleocr.py文件中进行相应的修改。具体修改方法是将"rec_char_dict_path"和"table_char_dict_path"两个参数的默认值设为None。字典文件的格式应该以utf-8编码格式保存,并且应该写成如下所示的格式:
<字符1>
<字符2>
<字符3>
...
<字符n>
请根据上述说明设置和使用你所需的字典文件。
阅读全文