from PIL import Image # import pytesseract import requests import uuid import time import cv2 def get_verify_code(uuid): url = f'https://dm.zjleiming.cn:9898/user/captcha?uuid={uuid}' response = requests.get(url) return response.content def main(): uuid = (str(time.time())) image = get_verify_code(uuid) with open('code.png', 'wb') as f: f.write(image) code = cv2.imread('code.png') blur = cv2.pyrMeanShiftFiltering(code, sp=8, sr=60) gray_code = cv2.cvtColor(blur, cv2.COLOR_BGR2GRAY) ret, binary_code = cv2.threshold(gray_code, 160, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU) kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 2)) bin1 = cv2.morphologyEx(binary_code, cv2.MORPH_OPEN, kernel) kernel = cv2.getStructuringElement(cv2.MORPH_OPEN, (2, 3)) bin2 = cv2.morphologyEx(bin1, cv2.MORPH_OPEN, kernel) cv2.bitwise_not(bin2, bin2) erode = cv2.erode(bin2, None, iterations=1) dilate = cv2.dilate(erode, None, iterations=1) #cv2.imshow('dilate', dilate) # 逻辑运算 让背景为白色 字体为黑 便于识别 # cv2.imshow('bin1', bin1) # cv2.imshow('bin2', bin2) cv2.imshow('1', code) cv2.waitKey(0) img = Image.fromarray(bin2) codes = pytesseract.image_to_string(img) print(codes) if __name__ == '__main__': main()
时间: 2024-04-28 12:23:15 浏览: 59
这段代码是用于识别图片验证码的,主要使用了OpenCV和pytesseract库。它首先通过网络请求获取验证码图片,然后使用OpenCV对图片进行处理,包括滤波、二值化、形态学处理等,最后将处理后的图片转换为PIL格式,使用pytesseract对验证码进行识别,输出识别结果。通过这段代码,可以实现自动化识别验证码的功能。
相关问题
from pil import image ##调用库 def basic_information(path): #*********** beg
Python中有一个名为PIL(Python Imaging Library)的模块,它提供了一个名为Image的类,可以使用它来处理图像文件。通过使用import语句,可以将PIL模块中的Image类导入到当前的Python脚本中。这样就能够使用PIL模块中提供的丰富功能来加载、保存、处理和生成图像。比如,可以使用Image类来打开一个图像文件,对图像进行各种操作,比如缩放、裁剪、旋转等,然后保存处理后的图像文件。另外,还可以从图像中获取各种信息,比如图像的大小、格式、颜色等。总之,通过导入PIL模块中的Image类,我们就可以在Python中方便地进行图像处理和操作。
import os from PIL import Image import pytesseract from openpyxl import Workbook def ocr(image_path): img = Image.open(image_path) result = pytesseract.image_to_string(img, lang='eng') return result def save_to_excel(result_list): wb = Workbook() ws = wb.active for result in result_list: ws.append([result]) wb.save('result.xlsx') if __name__ == '__main__': image_dir = r'C:\Users\KevinGuo\OneDrive\桌面\1.jpg' # 图片所在目录 result_list = [] for image_name in os.listdir(image_dir): image_path = os.path.join(image_dir, image_name) result = ocr(image_path) result_list.append(result) save_to_excel(result_list) print('处理完成!')
代码中存在问题,需要进行修改。具体问题如下:
1. image_dir指定的是图片文件的路径,而不是图片所在的目录。如果需要处理多张图片,请将image_dir指定为图片所在的目录。
2. os.listdir()返回的是指定目录下的所有文件和子目录,如果需要筛选出图片文件,请使用os.path.splitext()函数,判断文件扩展名是否为图片格式。
3. 处理单张图片时,需要将result_list改为result,因为只有一张图片。
修改后的代码如下:
```python
import os
from PIL import Image
import pytesseract
from openpyxl import Workbook
def ocr(image_path):
img = Image.open(image_path)
result = pytesseract.image_to_string(img, lang='eng')
return result
def save_to_excel(result):
wb = Workbook()
ws = wb.active
ws.append([result])
wb.save('result.xlsx')
if __name__ == '__main__':
image_path = r'C:\Users\KevinGuo\OneDrive\桌面\1.jpg' # 图片文件路径
result = ocr(image_path)
save_to_excel(result)
print('处理完成!')
```
以上代码是处理单张图片并将OCR识别结果存入Excel的示例代码。如果需要处理多张图片,可以参考之前的代码示例,使用for循环进行处理。
阅读全文