python2.7识别图片数字,不使用cv2
时间: 2023-12-11 21:05:09 浏览: 43
可以使用Python的PIL库来识别图片中的数字。以下是一个简单的示例代码:
```python
from PIL import Image
def recognize_digit(image_path):
img = Image.open(image_path).convert('L')
img = img.point(lambda x: 0 if x<128 else 255, '1')
digit = ''
for i in range(4):
box = (i*10, 0, (i+1)*10, 20)
region = img.crop(box)
if region.getbbox():
digit += str(i)
return digit
```
这个函数可以接收一个图片路径作为输入参数,返回图片中的数字。该函数首先使用PIL库打开图片,然后将其转化为灰度图像。接着将其转换为二值图像(黑白图像),并将像素值小于128的点设为0,大于等于128的点设为255。最后,函数通过循环遍历图像的四个部分,判断每个部分是否存在数字,如果存在则将其添加到返回结果中。
相关问题
python2.7识别图片数字
要在Python 2.7中识别图片中的数字,可以使用OpenCV和Tesseract OCR库的组合。以下是一个简单的示例代码,可以读取图像并使用Tesseract OCR识别数字。
```python
import cv2
import pytesseract
# 读取图像
img = cv2.imread('image.jpg')
# 转为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 二值化处理
bw = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
# 使用Tesseract OCR进行数字识别
digits = pytesseract.image_to_string(bw, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
# 输出识别结果
print(digits)
```
请注意,这里使用的是Tesseract OCR的默认配置,你可以根据需要进行调整。另外,如果你的图片中包含干扰线或其他干扰物,可能需要进行一些图像处理操作来提高识别准确率。
将#!/usr/bin/env python2.7 -- coding: UTF-8 -- import time import cv2 from PIL import Image import numpy as np from PIL import Image if name == 'main': rtsp_url = "rtsp://127.0.0.1:8554/live" cap = cv2.VideoCapture(rtsp_url) #判断摄像头是否可用 #若可用,则获取视频返回值ref和每一帧返回值frame if cap.isOpened(): ref, frame = cap.read() else: ref = False #间隔帧数 imageNum = 0 sum=0 timeF = 24 while ref: ref,frame=cap.read() sum+=1 #每隔timeF获取一张图片并保存到指定目录 #"D:/photo/"根据自己的目录修改 if (sum % timeF == 0): # 格式转变,BGRtoRGB frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) # 转变成Image frame = Image.fromarray(np.uint8(frame)) frame = np.array(frame) # RGBtoBGR满足opencv显示格式 frame = cv2.cvtColor(frame, cv2.COLOR_RGB2BGR) imageNum = imageNum + 1 cv2.imwrite("/root/Pictures/Pictures" + str(imageNum) + '.png', frame) print("success to get frame") #1毫秒刷新一次 k = cv2.waitKey(1) #按q退出 #if k==27:则为按ESC退出 if k == ord('q'): cap.release() break和#!/usr/bin/env python2.7 coding=UTF-8 import os import sys import cv2 from pyzbar import pyzbar def main(image_folder_path, output_file_name): img_files = [f for f in os.listdir(image_folder_path) if f.endswith(('.png'))] qr_codes_found = [] print("Image files:") for img_file in img_files: print(img_file) for img_file in img_files: img_path = os.path.join(image_folder_path,img_file) img = cv2.imread(img_path) barcodes = pyzbar.decode(img) for barcode in barcodes: if barcode.type == 'QRCODE': qr_data = barcode.data.decode("utf-8") qr_codes_found.append((img_file, qr_data)) unique_qr_codes = [] for file_name, qr_content in qr_codes_found: if qr_content not in unique_qr_codes: unique_qr_codes.append(qr_content) with open(output_file_name,'w') as f: for qr_content in unique_qr_codes: f.write("{}\n".format(qr_content)) if name == "main": image_folder_path = '/root/Pictures' output_file_name = 'qr_codes_found.txt' main(image_folder_path,output_file_name)合并一下
您可以将两个代码合并为一个ROS节点,以便在同一个程序中运行。下面是合并后的代码:
```python
#!/usr/bin/env python2.7
# -*- coding: UTF-8 -*-
import time
import cv2
from PIL import Image
import numpy as np
from PIL import Image
import os
import sys
from pyzbar import pyzbar
from std_msgs.msg import String
import rospy
def capture_and_recognize():
# 初始化ROS节点
rospy.init_node('capture_and_recognize_node', anonymous=True)
# 创建图像识别结果的发布者
pub = rospy.Publisher('recognition_result', String, queue_size=10)
# 设置摄像头参数
rtsp_url = "rtsp://127.0.0.1:8554/live"
cap = cv2.VideoCapture(rtsp_url)
# 判断摄像头是否可用
# 若可用,则获取视频返回值ref和每一帧返回值frame
if cap.isOpened():
ref, frame = cap.read()
else:
ref = False
# 间隔帧数
imageNum = 0
sum = 0
timeF = 24
while ref:
ref, frame = cap.read()
sum += 1
# 每隔timeF获取一张图片并保存到指定目录
# "D:/photo/"根据自己的目录修改
if (sum % timeF == 0):
# 格式转变,BGRtoRGB
frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
# 转变成Image
frame = Image.fromarray(np.uint8(frame))
frame = np.array(frame)
# RGBtoBGR满足opencv显示格式
frame = cv2.cvtColor(frame, cv2.COLOR_RGB2BGR)
imageNum = imageNum + 1
cv2.imwrite("/root/Pictures/Pictures" + str(imageNum) + '.png', frame)
print("success to get frame")
# 图像识别
img_path = "/root/Pictures/Pictures" + str(imageNum) + '.png'
img = cv2.imread(img_path)
barcodes = pyzbar.decode(img)
qr_codes_found = []
for barcode in barcodes:
if barcode.type == 'QRCODE':
qr_data = barcode.data.decode("utf-8")
qr_codes_found.append(qr_data)
unique_qr_codes = []
for qr_content in qr_codes_found:
if qr_content not in unique_qr_codes:
unique_qr_codes.append(qr_content)
# 发布图像识别结果
for qr_content in unique_qr_codes:
pub.publish(qr_content)
# 1毫秒刷新一次
k = cv2.waitKey(1)
# 按q退出
# 如果按下的是q键,则退出循环
if k == ord('q'):
cap.release()
break
if __name__ == '__main__':
try:
capture_and_recognize()
except rospy.ROSInterruptException:
pass
```
在这个合并的代码中,我们使用了ROS的Python库rospy来创建一个ROS节点。我们初始化了一个节点,创建了一个用于发布图像识别结果的话题,并在适当的位置发布识别结果。您可以根据需要进一步调整代码以满足您的机器人运行环境的要求。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)