CnOCR：PyTorch/MXNet下的多语言文字识别工具包

版权申诉

73 浏览量更新于2024-10-05 收藏 15.31MB ZIP 举报

资源摘要信息:"CnOCR是一个在Python 3环境下开发的光学字符识别工具包，专门用于识别不同语言的文字。CnOCR支持简体中文、繁体中文、英文以及数字识别，并且可以处理竖排文字。该工具包预先集成了20多个训练好的模型，覆盖多种应用场景，用户可以直接安装后使用，同时也支持用户根据需要自行训练模型。模型根据不同的使用场景分为三类：scene、doc和number。scene类模型主要用于识别拍照图片中的文字；doc类模型则适用于识别规则文档的截图，例如书籍扫描件；number类模型专注于识别纯数字字符，适用于识别银行卡号或身份证号等场景。除了提供识别功能，CnOCR还包括简单的模型训练命令，以便用户能够根据自己的需求定制和优化模型。" 知识点详细说明： 1. OCR技术与应用光学字符识别（Optical Character Recognition, OCR）是一种将图像中的文字转化为可编辑文本的技术。CnOCR作为一个基于Python的OCR工具包，为开发者提供了一种快速识别图像中文字内容的手段，可以广泛应用于图像处理、数据录入、内容管理等领域。 2. 中文和英文文字识别 CnOCR支持中文（简体和繁体）以及英文的文字识别，使得其应用场景覆盖了包括但不限于中文文档的数字化、英文文献的整理、多语言数据的快速录入等。繁体中文的识别虽然只支持部分模型，但为处理历史文献或面向港澳台地区的应用提供了可能性。 3. 竖排文字识别在处理古籍、历史文献或某些特殊的艺术作品时，文字往往是竖排的。CnOCR能够处理竖排文字，使其在文化保护和研究领域具有独特的应用价值。 4. 预训练模型与自定义训练 CnOCR提供20多个预训练模型，覆盖不同的应用场景，用户无需从零开始训练模型，可以直接应用到自己的项目中。同时，它也允许用户根据特定需求使用简单的命令来训练自己的模型，增加了解决问题的灵活性。 5. 模型分类 CnOCR将模型按照使用场景分为scene（场景图片）、doc（文档图片）和number（纯数字图片）三个类别。这种分类有助于用户根据实际需求选择最合适的模型，提高文字识别的准确性和效率。 6. PyTorch/MXNet框架 CnOCR作为PyTorch和MXNet框架下的工具包，受益于这些深度学习框架的丰富功能和高效的计算能力。开发者可以在熟悉这些框架的基础上，更方便地使用和扩展CnOCR的功能。 7. 资源文件说明文件名称列表中的"cnocr-master"表明用户可以通过访问这个名称所指向的源代码仓库，获取到CnOCR的最新版本和源代码。这为需要进行定制开发或贡献代码的用户提供了一个直接的入口。 CnOCR作为一款开源的OCR工具包，利用了深度学习技术来提高文字识别的准确率，通过提供预训练模型和自定义训练命令，大大降低了技术门槛，使得非专业人员也能快速上手使用。同时，其对中文、英文及数字的全面支持，使得它在多语言环境下具有广泛的应用前景。

收起资源包目录

基于 PyTorch/MXNet 的中文/英文 OCR Python 包（155个子文件）

image-formula-text.Makefile 929B

multi-line_cn2.png 84KB

install.md 3KB

abnormal_labels0.png 15KB

cnocr-qq.jpg 47KB

20457890_2399557098.jpg 2KB

utils.py 15KB

cn_ocr.md 16B

README.md 22KB

clf_command.md 3KB

cli.py 20KB

captcha.jpg 4KB

helloworld.jpg 4KB

trainer.py 13KB

hybrid.png 8KB

00010991.jpg 4KB

lr_scheduler.py 7KB

en_book1.jpeg-result.jpg 97KB

models.md 11KB

shupai.png-result.jpg 272KB

im2rec.py 18KB

rand_cn1.png 4KB

00199979.jpg 6KB

LICENSE 41KB

fanti.jpg-result.jpg 558KB

multi-line_en_white.png 79KB

contact.md 1KB

demo.md 161B

demo.jpg 490KB

train_config.json 709B

aobama.webp-result.jpg 63KB

rand_cn2.png 516B

train_config_gpu.json 786B

breezedeus.png 20KB

00199985.jpg 3KB

std-ocr.jpg 237KB

fapiao.jpeg-result.jpg 1.38MB

std_ocr.md 533B

faq.md 2KB

consts.py 13KB

00199971.jpg 5KB

pp_recognizer.py 10KB

en_book1.jpeg 44KB

chn-00199981.jpg 4KB

app.py 7KB

utility.py 20KB

custom.css 4KB

sample-data_test.lst 725B

recognizer.py 17KB

cnstd_cnocr.md 1KB

Dockerfile 467B

RELEASE.md 9KB

shupai.png 871KB

pp_recognizer.md 29B

transforms.py 15KB

chn-00199984.jpg 4KB

multi-line_cn1.png 43KB

intro-cnstd-cnocr.pdf 3.75MB

train.md 3KB

chn-00199989.jpg 4KB

multi-line_en_black.png 69KB

test_cnocr.py 9KB

00199975.jpg 5KB

sample-data_train.lst 273B

breezedeus.ico 4KB

00010965.jpg 3KB

chn-00199980.jpg 5KB

usage.md 17KB

clf_cli.py 8KB

captcha1.png 1KB

abnormal_labels.png 4KB

README_en.md 23KB

huochepiao.jpeg-result.jpg 578KB

Makefile 2KB

huochepiao.jpeg 431KB

buymeacoffee.md 2KB

image_classifier.py 10KB

taobao4.jpg 140KB

requirements.in 330B

jiankangbao.jpeg-result.jpg 444KB

gpu.Makefile 2KB

index.md 10KB

sample-data_train.idx 19B

cnocr-logo.jpg 87KB

cnocr-zsxq.jpeg 255KB

chn-00199985.jpg 7KB

00010994.jpg 6KB

cnocr-zfb.jpg 155KB

sample-data_test.idx 59B

train_config.json 649B

rec_postprocess.py 26KB

recognizer.md 20B

00199980.jpg 4KB

00199978.jpg 4KB

command.md 8KB

.gitattributes 66B

wx-qr-code.JPG 109KB

fanti.jpg 334KB

ocr_model.py 12KB

cn_ocr.py 17KB

共 155 条

传奇开心果编程

粉丝: 1w+
资源: 454

CnOCR：PyTorch/MXNet下的多语言文字识别工具包

PyTorch/MXNet支持的中英文OCR工具包cnocr介绍

CnOCR：基于PyTorch/MXNet的OCR技术实现

个人学习Python AI框架：TensorFlow、PyTorch与MXNet

如何利用CnOCR进行多语言文字识别，并通过PyTorch或MXNet自定义训练模型？

如何使用CnOCR在PyTorch和MXNet环境下进行中文和英文的文字识别？请结合CnOCR的功能特点，详细介绍安装和使用方法。

如何使用CnOCR进行基本的文字识别？请结合CnOCR的功能特点，介绍其在PyTorch和MXNet环境下的安装和使用方法。

CnOCR-Python包：中文/英文OCR技术实现

基于PyTorch/MXNet的CnOCR中文英文识别开源Python包

基于 PyTorch/MXNet 的中文/英文 OCR Python 包cnocr-master.zip

CnOCR-python

最新资源