用python 批量识别票据,一张票据包含多个商品,逐个识别导入excel 表格,并识别真伪
时间: 2024-02-25 20:52:07 浏览: 74
毕业设计基于Opencv实现的票据OCR识别python源码+项目说明.zip
可以使用Python的OCR库,如Tesseract或OpenCV,对票据图像进行处理和分析,同时使用第三方库,如pytesseract、opencv-python等来操作OCR库。以下是实现批量识别票据、导入Excel表格和识别真伪的简单示例代码:
```python
import cv2
import pytesseract
import xlsxwriter
# 扫描所有票据图像文件
for i in range(1, 6): # 假设有5张票据,文件名为1.jpg, 2.jpg, ..., 5.jpg
img = cv2.imread(str(i) + ".jpg")
text = pytesseract.image_to_string(img, lang='chi_sim') # 识别票据上的文本信息
# 分析票据文本信息,提取商品信息,以及真伪信息
# ...
# 将提取出来的商品信息和真伪信息写入Excel表格
workbook = xlsxwriter.Workbook('output.xlsx')
worksheet = workbook.add_worksheet()
# 将商品信息和真伪信息写入Excel表格的相应单元格中
worksheet.write('A1', '商品名称')
worksheet.write('B1', '单价')
worksheet.write('C1', '数量')
worksheet.write('D1', '总价')
worksheet.write('E1', '真伪')
# 写入多个商品信息和真伪信息
for j in range(len(products)):
worksheet.write(j + 1, 0, products[j]['name'])
worksheet.write(j + 1, 1, products[j]['price'])
worksheet.write(j + 1, 2, products[j]['quantity'])
worksheet.write(j + 1, 3, products[j]['total'])
worksheet.write(j + 1, 4, products[j]['authentic'])
# 保存Excel表格
workbook.close()
```
以上代码仅为示例,具体实现还需要根据实际情况进行调整和修改。
阅读全文