识别图片文字的python代码
时间: 2023-09-16 20:14:55 浏览: 42
以下是Python识别图片文字的代码示例:
```python
import pytesseract
from PIL import Image
# 读取图片并转换为灰度图像
image = Image.open('example.jpg').convert('L')
# 使用pytesseract识别图片中的文字
text = pytesseract.image_to_string(image)
# 输出识别结果
print(text)
```
需要注意的是,此代码需要使用pytesseract和Pillow库。在运行之前,请确保已经安装这两个库。另外,需要将example.jpg替换为你要识别的图片路径。
相关问题
图片识别文字python代码
以下是一个利用Python实现图片识别文字的代码示例:
```python
import pytesseract
from PIL import Image
# 将图片转换为黑白
def convert_to_bw(image):
img = image.convert('L')
threshold = 127
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
return img.point(table, '1')
# 识别图片中的文字
def recognize_text(image):
text = pytesseract.image_to_string(image, lang='chi_sim')
return text
# 读取图片
image = Image.open('test.png')
# 转换为黑白
bw_image = convert_to_bw(image)
# 识别文字
text = recognize_text(bw_image)
# 输出识别结果
print(text)
```
这个例子使用了pytesseract库和PIL库,其中pytesseract库提供了OCR(Optical Character Recognition)功能,PIL库提供了图片处理的功能。代码中,首先将彩色图片转换为黑白图片,然后利用pytesseract库识别图片中的文字,最后输出识别结果。此代码示例适用于中文字符识别,若需识别其他语言字符,需要更改lang参数。
批量图片识别文字python代码
以下是利用Python进行批量图片识别文字的代码:
```
import pytesseract
from PIL import Image
import os
# 设置tesseract文件路径
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# 待识别图片路径
image_folder = "path/to/image/folder"
# 识别结果保存路径
result_folder = "path/to/result/folder"
# 循环处理文件夹中的图片
for filename in os.listdir(image_folder):
if filename.endswith(".png") or filename.endswith(".jpg"):
# 打开图片
img = Image.open(os.path.join(image_folder, filename))
# 识别图片中的文字
text = pytesseract.image_to_string(img, lang='eng')
# 保存识别结果
with open(os.path.join(result_folder, f"{filename}.txt"), "w", encoding="utf-8") as f:
f.write(text)
```
上述代码中,需要设置tesseract文件路径,也就是tesseract.exe文件所在路径。同时需要指定待识别图片路径和识别结果保存路径。循环处理图片时,使用`os.listdir()`函数获取文件夹中的文件名列表,使用`os.path.join()`函数拼接文件路径,打开图片并使用`pytesseract.image_to_string()`函数进行文字识别,最后将识别结果保存到指定路径下的txt文件中。