paddleocr CRNN
时间: 2023-07-27 21:08:27 浏览: 191
PaddleOCR中的CRNN是一种将CNN和RNN网络结合起来的模型,用于对不定长的文本序列进行识别。它的网络结构包含三个部分:CNN(卷积层)、RNN(循环层)和CTC loss(转录层)。CNN用于提取输入图像的特征,得到特征图;RNN使用双向LSTM对特征序列进行预测,输出预测标签分布;CTC loss将从循环层获取的一系列标签分布转换成最终的标签序列。CRNN还引入了Batch Normalization模块,加速模型收敛,缩短训练过程。整个CRNN网络结构的输入是灰度图像,高度为32,宽度为160,经过CNN后得到512个特征图,每个特征图的高度为1,宽度为40。RNN使用LSTM来捕获长距离依赖,采用双向LSTM网络来获取两个方向的上下文信息。最后,CTC loss用于将RNN的预测转换成标签序列。通过CRNN模型,可以实现对文本序列的端到端识别。\[1\]\[2\]\[3\]
#### 引用[.reference_title]
- *1* *2* *3* [Week3:CRNN文本识别](https://blog.csdn.net/weixin_45873017/article/details/120814531)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文