pytesseract识别图片
时间: 2023-11-11 07:07:18 浏览: 76
识别图片中的字符.zip
pytesseract是一个Python开源的OCR(光学字符识别)库,可以用于识别图片上的数字、英文和中文等文字。它可以通过一行代码实现提取图片文本的功能。你可以使用pytesseract库中的image_to_string函数来实现这个目标。例如,你可以使用以下代码来识别名为'img.png'的图片中的文字:
from PIL import Image
import pytesseract
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
read_image('img.png')
if __name__ == '__main__':
main()
在这个例子中,read_image函数接受图片的文件名作为参数,并通过image_to_string函数将图片中的文字提取出来并打印出来。你可以通过更改参数'chi_sim'来选择不同的语言进行识别。希望这个例子可以帮助你理解如何使用pytesseract来识别图片。
阅读全文