超轻量级8.6M中文OCR工具库，支持多语言和长文本识别

版权申诉

102 浏览量更新于2024-09-27 收藏 195.47MB ZIP 举报

资源摘要信息:"OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别同时支持多种文本" OCR（光学字符识别）技术是一项将图片或扫描文档中的文字转换为可编辑、可搜索的文本数据的技术。随着数字化进程的不断推进，OCR技术的应用变得越来越广泛。本资源库提供了一个仅8.6MB大小的超轻量级中文OCR工具库，支持多种文本识别功能，极大地方便了开发者的使用。首先，该OCR工具库支持中英文数字的混合识别。传统的OCR工具往往只能处理单一语言的文本，而在全球化和多语种混合使用的今天，需要一种能够跨越语言障碍的工具。此工具库正是针对这一需求开发的，可以同时处理中文、英文以及数字的组合文本，大大提升了多语言应用场景下的文本识别效率。其次，工具库具备竖排文本识别的能力。竖排文本常见于东亚语言，如中文、日文和韩文古籍等。传统的OCR工具往往不具备处理竖排文本的能力，或者处理效果不佳。这项功能对于图书馆、档案馆以及文化研究机构等机构的数字化工作尤为重要。它能够帮助这些机构更快地将传统的竖排文本资料转换为数字格式，便于保存和检索。第三，该工具库还支持长文本的识别。长文本识别在处理学术论文、书籍、法律文件等长篇文档时尤为重要。这些类型的文档往往包含大量的文本信息，如果没有高效的识别能力，手动输入或者使用低效的OCR工具会耗费大量的时间和精力。因此，长文本识别功能可以大大提升文本数据的提取效率和准确性，对于需要大量处理文档的行业来说，这是一个非常有价值的功能。除了以上提到的功能外，该OCR工具库还支持多种文本检测和识别的训练算法。这意味着开发者可以根据不同场景需求，选择或者开发合适的算法模型，进一步提升工具库的识别性能和适应性。这种灵活性使得OCR工具库在各种不同的使用场景中都能提供稳定可靠的服务。总的来说，这款OCR工具库的优势在于其轻量级的设计、多语言的识别能力、竖排文本和长文本处理能力以及多种文本检测和识别算法的支持。这些特点使其成为开发人员在构建文本识别应用时的理想选择，尤其是在需要处理大量文本数据、多语言或特殊格式文本的应用场景中，该工具库都能发挥重要作用，简化开发流程，提升工作效率和识别准确性。

收起资源包目录

OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别同时支持多种文本（2000个子文件）

MainActivity.java 20KB

ocr_clipper.cpp 135KB

postprocess_op.h 4KB

ocr_det.cpp 5KB

20210816_210413.gif 413KB

ocr_cls_process.h 799B

custom_relu_op.cu 3KB

ocr_clipper.hpp 14KB

OcrSettingsActivity.java 10KB

utility.cpp 13KB

AppCompatPreferenceActivity.java 3KB

0639da09b774458096ae577e82b2c59e89ced6a00f55458f946997ab7472a4f8.jpeg 250KB

custom_relu_op.cc 4KB

0d582de9aa46474791e08654f84a614a6510e98bfe5f4ad3a26501cbf49ec151.jpeg 87KB

ocr_db_post_process.cpp 10KB

index.html 370B

ResultListView.java 1KB

1bbe854b8817dedb8585e0732089fd1f752d2cec.jpeg 181KB

ocr_ppredictor.h 3KB

structure_table.h 3KB

AppCompatPreferenceActivity.java 4KB

preprocess_op.cpp 5KB

ocr_det.h 3KB

45f288ce8b2c45d8aa5407785b4b40f4876fc3da23744bd7a78060797fba0190.jpeg 97KB

ocr_rec.h 3KB

predictor_output.cpp 642B

9bd844b970f94e5ba0bc0c5799bd819ea9b1861bb306471fabc2d628864d418e.jpeg 135KB

a3b25766f3074d2facdf88d4a60fc76612f51992fd124cf5bd846b213130665b.jpeg 533KB

fe350481be0241c58736d487d1bf06c2e65911bf01254a79944be629c4c10091.jpeg 174KB

OcrResultModel.java 2KB

db_post_process.h 2KB

preprocess.cpp 3KB

structure_layout.cpp 6KB

ocr_crnn_process.h 528B

crnn_process.h 1KB

paddleocr.cpp 7KB

native.cpp 4KB

Utils.java 5KB

preprocess_op.h 2KB

comments.html 2KB

cls_process.h 906B

OcrMainActivity.java 20KB

ExampleInstrumentedTest.java 769B

predictor_output.h 950B

ocr_ppredictor.cpp 12KB

ppredictor.h 1KB

ocr_rec.cpp 7KB

.gitattributes 65B

ppredictor.cpp 3KB

clipper.h 14KB

46258d0dc9dc40bab3ea0e70434e4a905646df8a647f4c49921e217de5142def.jpeg 332KB

ExampleUnitTest.java 392B

predictor_input.h 613B

.gitkeep 0B

BaseResultModel.java 800B

tvm_runtime.h 2KB

ExampleInstrumentedTest.java 740B

07c3b060c54e4b00be7de8d41a8a4696ff53835343cc4981aab0555183306e79.jpeg 88KB

4de19ca3e54343e88961e816cad28bbacdc807f40b9440be914d871b0a914570.jpeg 497KB

predictor_input.cpp 775B

SettingsActivity.java 9KB

OCRPredictorNative.java 3KB

a3b25766f3074d2facdf88d4a60fc76612f51992fd124cf5bd846b213130665b-0097611.jpeg 533KB

common.h 1KB

general_detection_op.cpp 13KB

3d762970e2184177a2c633695a31029332a4cd805631430ea797309492e45402.jpeg 158KB

args.cpp 4KB

ocr_cls.cpp 6KB

paddlestructure.cpp 10KB

2769.jpeg 175KB

BaseResultAdapter.java 2KB

main.cpp 7KB

preprocess.h 371B

ocr_cls.h 2KB

.gitignore 133B

structure_table.cpp 7KB

d9e0533cc1df47ffa3bbe99de9e42639a3ebfa5bce834bafb1ca4574bf9db684.jpeg 143KB

structure_layout.h 2KB

native.h 5KB

ocr_cls_process.cpp 1KB

3dc7f69fac174cde96b9d08b5e2353a1d88dc63e7be9410894c0783660b35b76.jpeg 97KB

postprocess_op.cpp 19KB

paddlestructure.h 2KB

infer.c 9KB

clipper.cpp 135KB

dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e.jpeg 101KB

utility.h 3KB

Predictor.java 9KB

.clang_format.hook 526B

Utils.java 11KB

crt_config.h 1001B

ocr_db_post_process.h 404B

CameraSurfaceView.java 15KB

ActionBarLayout.java 996B

demo_bare_metal.c 2KB

ocr_crnn_process.cpp 5KB

60b95b4945954f81a080a8f308cee66f83146479cd1142b9b6b1290938fd1df8.jpeg 98KB

args.h 2KB

166ce56d634c4c7589fe68fbc6e7ae663305dcc82ba144c781507341ffae7fe8.jpeg 89KB

paddleocr.h 2KB

共 2000 条

传奇开心果编程

粉丝: 1w+
资源: 454

超轻量级8.6M中文OCR工具库，支持多语言和长文本识别

基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别

基于PaddleOCR的C++代码修改并封装的.NET的工具类库

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地.rar

paddleocr.ocr

paddleocr多字母

如何使用cnocr进行简体中文和繁体中文的竖排文字识别？请详细说明整个操作流程。

cnocr在处理竖排繁体中文时的性能如何？相较于简体中文，有哪些特殊要求和处理技巧？

paddleocr 直接用生成环境

drawio竖排文本

paddleocr文字识别

最新资源