paddleocr表格识别用到了哪些算法
时间: 2023-09-30 22:06:57 浏览: 82
表格识别ocr模型,基于paddleocr训练,可以识别中英文表格数据
PaddleOCR表格识别主要用到了以下算法:
1. 文本检测算法:基于PaddleDetection中的PSENet算法,可以检测表格中的文本区域。
2. 文本识别算法:主要采用CRNN(Convolutional Recurrent Neural Network)算法,可以将文本区域中的文字识别出来。
3. 表格结构分析算法:通过分析表格的行列结构,可以将表格中的内容归类,从而更好地进行后续处理。
4. 表格重构算法:将识别出的表格内容进行重新排列和组合,生成最终的表格结果。
总的来说,PaddleOCR表格识别主要借助了文本检测、文本识别和表格结构分析等多种算法,并将它们有机地结合起来,从而实现了高效、准确的表格识别功能。
阅读全文