遍历文件夹,直到找到pdf文件为止
时间: 2024-12-01 16:30:32 浏览: 17
在Python中,可以使用`os`和`glob`模块来遍历文件夹并查找PDF(Portable Document Format)文件。以下是一个基本的例子:
```python
import os
import glob
def find_pdf_in_dir(directory, extension=".pdf"):
pdf_files = []
for root, dirs, files in os.walk(directory):
for file in files:
if file.endswith(extension):
full_path = os.path.join(root, file)
pdf_files.append(full_path)
return pdf_files
# 使用方法
directory_to_search = "/path/to/your/directory"
pdf_files = find_pdf_in_dir(directory_to_search)
for file in pdf_files:
print(f"Found PDF file: {file}")
```
这个函数会从指定的起始目录开始,递归地搜索所有的子目录,并将所有找到的`.pdf`文件的完整路径添加到列表中。
相关问题
如何遍历文件夹中所有pdf文件
遍历文件夹中所有PDF文件通常可以使用Python的内置库`os`。下面是一个简单的示例,它会递归地搜索指定文件夹及其子文件夹,并找到所有的`.pdf`文件:
```python
import os
def list_pdf_files(directory):
pdf_files = []
for root, dirs, files in os.walk(directory): # os.walk遍历目录
for file in files:
if file.endswith('.pdf'): # 检查是否是PDF文件
full_path = os.path.join(root, file)
pdf_files.append(full_path) # 添加文件路径
return pdf_files
directory_to_search = 'D:/data/data/B题/B题-特殊医学用途配方食品数据分析/数据/特医食品说明书'
pdf_file_list = list_pdf_files(directory_to_search)
遍历U盘文件夹统计PDF文件总数
遍历U盘文件夹统计PDF文件总数通常需要通过编程语言来实现,这里以Python为例,因为Python有丰富的库如`os`和`PyPDF2`可以处理这种任务。以下是简单的步骤:
1. 导入必要的模块:
```python
import os
import PyPDF2
```
2. 定义一个函数,用于检查文件是否为PDF:
```python
def is_pdf(file_path):
try:
with open(file_path, 'rb') as f:
PyPDF2.PdfFileReader(f)
return True
except (IsADirectoryError, PyPDF2.utils.PdfReadError):
return False
```
3. 使用递归或循环遍历U盘目录树,并计数PDF文件:
```python
def count_pdf_in_dir(root_dir):
pdf_count = 0
for dirpath, dirs, files in os.walk(root_dir):
for file in files:
if is_pdf(os.path.join(dirpath, file)):
pdf_count += 1
return pdf_count
# 替换'u盘路径'为实际的U盘路径
pdf_total = count_pdf_in_dir('u盘路径')
```
4. 结果存储或打印:
```python
print(f"U盘上的PDF文件总数为: {pdf_total}")
```
阅读全文