使用python语言，帮我实现遍历读取文件夹下的所有JPG图片，并将JPG图中的文字内容转换为Excel存储

时间: 2024-09-23 09:13:29 浏览: 41

对python遍历文件夹中的所有jpg文件的实例详解

python发现文件夹下所有的jpg文件，并且安装文件排放的顺序输出 glob模块是最简单的模块之一，内容非常少。用它可以查找符合特定规则的文件路径名。跟使用windows下的文件搜索差不多。查找文件只用到三个匹配符：”*”, “?”, “[]”。”*”匹配0个或多个字符；”?”匹配单个字符；”[]”匹配指定范围内的字符，如：[0-9]匹配数字。 glob.glob 返回所有匹配的文件路径列表。它只有一个参数pathname，定义了文件路径匹配规则，这里可以是绝对路径，也可以是相对路径。下面是使用glob.glob的例子： Python import glob #获取指定目录下的所有图片 p 在Python编程中，遍历文件夹并处理其中的特定类型文件是一个常见的任务，尤其是在处理大量数据或进行自动化脚本时。本篇文章将详细介绍如何使用Python的`glob`模块来查找和遍历文件夹中的所有`.jpg`图片文件，并提供相关的实例代码。 `glob`模块是Python标准库的一部分，用于搜索符合特定模式的文件路径名。它主要使用通配符（wildcards）进行匹配，通配符包括： 1. `*`：匹配0个或多个任意字符。 2. `?`：匹配单个任意字符。 3. `[ ]`：匹配指定范围内的字符，例如`[0-9]`匹配任何数字。以下是一个基本的示例，展示如何使用`glob.glob()`函数来获取指定目录下所有`.jpg`文件的路径： ```python import glob # 获取指定目录下的所有.jpg图片 print(glob.glob(r'E:/Picture/*/*.jpg')) ``` 这个例子中，`r'E:/Picture/*/*.jpg'`是一个路径模式，`*`表示任意子目录，第二个`*`表示匹配任何以`.jpg`结尾的文件。如果文件列表需要按照特定顺序排列，可以结合Python内置的`sort()`函数或者`sorted()`函数实现。下面的代码展示了如何按名称排序得到的文件路径列表： ```python import os import glob WSI_MASK_PATH = r'/home/jpg/' wsi_mask_paths = glob.glob(os.path.join(WSI_MASK_PATH, '*.jpg')) wsi_mask_paths.sort() ``` 在这个例子中，`os.path.join()`函数用于构建完整的文件路径，然后`sort()`函数对结果进行排序。除了`glob`模块，Python还提供了其他方法来遍历文件夹，例如使用`os`模块的`os.listdir()`和`os.walk()`。`os.listdir()`返回指定目录下的所有文件和子目录的名称，而`os.walk()`则是一个生成器，可以递归地遍历整个目录树。以下是一个使用`os.listdir()`的示例： ```python import os directory = r'E:/Picture' for filename in sorted(os.listdir(directory)): if filename.endswith('.jpg'): print(os.path.join(directory, filename)) ``` 如果你需要更深度的控制，例如遍历指定深度或忽略某些目录，可以使用`os.walk()`： ```python import os def traverse_directory(path, depth=0): for root, dirs, files in os.walk(path): if depth > 0 and depth == len(root.split(os.sep)): # 当达到指定深度时停止 break for file in sorted(files): if file.endswith('.jpg'): print(os.path.join(root, file)) traverse_directory(r'E:/Picture', depth=2) ``` 这个`traverse_directory`函数接受一个路径和深度参数，当到达指定深度时停止遍历。 Python提供了多种方式来遍历文件夹并处理其中的文件，可以根据具体需求选择合适的方法。无论是`glob`模块的通配符匹配，还是`os`模块提供的列表和递归遍历，都可以有效地帮助我们管理文件系统中的资源。在编写自动化脚本或处理大量数据时，这些工具非常实用。

在Python中，我们可以使用`os`, `PIL`（Pillow库，用于图像处理）和`openpyxl`（用于创建和操作Excel文件）这几个模块来完成这个任务。这里是一个基本的步骤概述： 1. 导入必要的库： ```python import os from PIL import Image import pytesseract import openpyxl ``` 2. 安装Tesseract OCR引擎：如果你还没有安装Tesseract，需要先安装它。你可以通过`pip install pytesseract`命令安装，然后还需要下载并配置它的语言包，因为Tesseract需要对应的语言识别。 3. 遍历文件夹并读取JPG图片： ```python folder_path = 'your_folder_path' # 替换为你的图片文件夹路径 images = [img for img in os.listdir(folder_path) if img.endswith('.jpg')] ``` 4. 对每张图片提取文本： ```python def extract_text(image_path): text = pytesseract.image_to_string(Image.open(image_path), lang='chi_sim') # 中文识别，可以替换为你所需的其他语言 return text texts = {img: extract_text(os.path.join(folder_path, img)) for img in images} ``` 5. 将结果写入Excel文件： ```python # 创建一个新的Excel工作簿 wb = openpyxl.Workbook() sheet = wb.active # 写入标题行 sheet['A1'] = 'Image Name' sheet['B1'] = 'Text Content' # 行号从2开始 row_num = 2 for image, content in texts.items(): sheet.cell(row=row_num, column=1).value = image sheet.cell(row=row_num, column=2).value = content row_num += 1 # 保存Excel文件 file_name = 'output.xlsx' wb.save(file_name) ``` 现在，你已经有一个名为`output.xlsx`的文件，其中包含了图片文件名及其相应的文本内容。

阅读全文

使用python语言，帮我实现遍历读取文件夹下的所有JPG图片，并将JPG图中的文字内容转换为Excel存储

相关推荐

Python与C++ 遍历文件夹下的所有图片实现代码

python使用openCV遍历文件夹里所有视频文件并保存成图片

生成代码（遍历读取文件夹内的.bmp图片，转换成jpg格式后转换为灰度图后在进行二分化处理）

我想使用python读取文件夹中的图片，将他们打乱后并重新命名保存

代码生成一个python遍历文件夹中的图片，并读取每张图片名称

帮我写一个遍历文件夹中的jpg图片的代码，并且循环放进img中

python opencv glob遍历文件夹下的所有图片

opencv遍历文件夹下图片修改后缀为.jpg

python遍历一个文件夹下的所有图片

读取桌面新建文件夹 将文件夹中图片转换成GIF格式 并输出到文件夹中python

CV2.imread读取图片会遍历文件夹下所有图片吗

python读取文件夹下所有图片

写一段python程序，实现功能为：读取data文件夹下的image图片，将其裁剪为100*60

python 读取文件夹中所有图片

python读取文件夹中所有图片

python代码实现读取文件夹中所有图像

使用python批量提取文件夹下面扫pdf图片中的文字内容并用正则筛选自己想要的数据，python版本为3.13

python读取文件夹中所有的图片和视频

在Python中，我如何将Excel文件中的图片重命名并保存到特定文件夹里？

最新推荐

python使用openCV遍历文件夹里所有视频文件并保存成图片

Python读取excel中的图片完美解决方法

使用python将图片按标签分入不同文件夹的方法

python+opencv 读取文件夹下的所有图像并批量保存ROI的方法

Python调用百度OCR实现图片文字识别的示例代码

高清艺术文字图标资源，PNG和ICO格式免费下载

管理建模和仿真的文件

DMA技术：绕过CPU实现高效数据传输

SGM8701电压比较器如何在低功耗电池供电系统中实现高效率运作？

mui框架HTML5应用界面组件使用示例教程

读取桌面新建文件夹将文件夹中图片转换成GIF格式并输出到文件夹中python