Tesseract_Ocr项目：Linux移植至VS2010的开源OCR工具

需积分: 9 95 浏览量更新于2024-11-04 收藏 25.9MB ZIP 举报

资源摘要信息:"Tesseract_Ocr是一个开源光学字符识别（OCR）项目，最初是作为Linux平台下的软件而开发的，后被移植到了Windows平台的Visual Studio 2010环境中。该项目的核心功能是对图像文件中的文字进行识别，并将其转换为电子文本格式。Tesseract_Ocr支持多种格式的压缩文件，可以用于处理和识别不同的图像和文档类型。项目基于多个开源库进行开发，具体包括： - zlib 1.2.7：一个通用的压缩和解压缩库； - lpng1514：libpng的库，用于读写PNG图片格式； - jpegsr9：JPEG图片格式的处理库； - tiff-4.0.3：处理TIFF图片格式的库； - giflib-5.0.4：处理GIF图片格式的库； - leptonica-1.69：一个开源的图像处理库； - tesseract-ocr3.0.2：光学字符识别引擎的主要版本。光学字符识别（OCR）技术是一种将印刷或手写的文字图像转化为机器编码文本的过程。这项技术广泛应用于印刷、打印行业，可以帮助用户快速地将纸质文档转换成电子文档。对于中文OCR技术来说，中国市场有清华文通、汉王、尚书等知名产品，而国外的许多大型科技公司如IBM、微软、HP等也研发了成熟的OCR技术，这些技术常被整合到它们自己的软件系统中。本项目特别地说明了如何在Windows平台下进行Tesseract-OCR的移植和编译。通常情况下，这样的移植工作需要处理不同平台之间的系统调用、文件路径、库依赖等问题，并确保在Windows环境下的兼容性。通过本项目的移植，开发者可以在Windows环境下利用Tesseract-OCR的强大功能。更新记录中提到的日期是2014年11月10日，但未给出具体的更新内容。从上下文中推断，这次更新可能与项目移植到Windows平台有关。此外，根据文件名称列表‘Tesseract_Ocr-master’，我们可以得知这是项目源代码的主分支，用户可以从中获取最新的源代码以进行开发或部署。 Tesseract_Ocr项目的移植表明了开源社区对跨平台开发的支持和贡献，使得更多的开发者和用户能够在不同的操作系统上利用先进的OCR技术。同时，这也反映了开源软件在实际应用中的灵活性和扩展性。"

收起资源包目录

Tesseract_Ocr项目：Linux移植至VS2010的开源OCR工具（1293个子文件）

convolve.c 66KB

dewarp.c 130KB

warper.c 51KB

transupp.c 56KB

numabasic.c 50KB

pix5.c 63KB

dnabasic.c 40KB

psio2.c 93KB

pix3.c 74KB

pngrutil.c 119KB

tif_jpeg.c 66KB

morphdwa.c 61KB

pngtest.c 55KB

utils.c 93KB

affine.c 57KB

blend.c 82KB

tiffcrop.c 292KB

pdfio.c 109KB

colorspace.c 52KB

pix4.c 99KB

compare.c 56KB

dwalinearlow.3.c 628KB

pixafunc1.c 52KB

tiff2ps.c 97KB

tif_pixarlog.c 40KB

roplow.c 73KB

jdmarker.c 45KB

jidctint.c 177KB

tif_dirinfo.c 47KB

colorquant1.c 160KB

tif_luv.c 42KB

enhance.c 64KB

sarray.c 57KB

ptafunc1.c 64KB

tiffio.c 71KB

jdhuff.c 47KB

colorquant2.c 61KB

tif_getimage.c 72KB

tif_fax3.c 44KB

pngread.c 38KB

jpegio.c 51KB

flipdetect.c 39KB

writefile.c 39KB

tiff2pdf.c 156KB

conncomp.c 39KB

jbclass.c 87KB

morph.c 62KB

pngwrite.c 50KB

jmemmgr.c 40KB

dwacomblow.2.c 139KB

pixabasic.c 50KB

jfdctint.c 155KB

scale.c 112KB

boxfunc3.c 38KB

tiffcp.c 50KB

fpix2.c 59KB

sel1.c 66KB

scalelow.c 93KB

adaptmap.c 104KB

jchuff.c 47KB

tessdata.7z 20.72MB

tif_dirread.c 137KB

morphapp.c 51KB

grayquant.c 68KB

boxfunc2.c 48KB

pixcomp.c 58KB

seedfilllow.c 71KB

trees.c 43KB

graphics.c 52KB

pixconv.c 106KB

colorcontent.c 40KB

pngrtran.c 165KB

boxbasic.c 46KB

pix2.c 79KB

colormap.c 48KB

egif_lib.c 38KB

morphseq.c 42KB

fpix1.c 48KB

jquant2.c 47KB

pngio.c 39KB

readbarcode.c 52KB

tif_ojpeg.c 75KB

maze.c 43KB

tif_dirwrite.c 86KB

numafunc2.c 84KB

ccbord.c 82KB

skew.c 46KB

pix1.c 46KB

tif_fax3sm.c 102KB

numafunc1.c 83KB

deflate.c 70KB

inflate.c 52KB

pngwutil.c 90KB

fmorphgenlow.1.c 202KB

png.c 91KB

correlscore.c 40KB

pixafunc2.c 38KB

tif_dir.c 45KB

seedfill.c 59KB

dgif_lib.c 40KB

共 1293 条

阚发景

粉丝: 23
资源: 4614

Tesseract_Ocr项目：Linux移植至VS2010的开源OCR工具

Tesseract 1.03在VS2005下的OCR C++源代码移植与图片识别

Tesseract-OCR在Python中识别中文图片内容的方法

toBraille：Java开源盲文库利用Tesseract OCR技术

tesseract-1.03_vs2005_OCR_tesseract-ocr_vs2005_Tesseract_

tesseract-1.03_vs2005_OCR_C++_vs2005_Tesseract_

-Antelope.OCR:通过OCR识别图片文字

tesseract-orc

Android Tesseract2

OCR-handwriting-recognition-libraries:OCR手写识别库对比

Tesseract-ORC.zip

最新资源