pdf_dir = 'pdf年报' txt_dir = 'txt年报' try: os.makedirs(pdf_dir, exist_ok=True) os.makedirs(txt_dir, exist_ok=True) except Exception as e: logging.error(f"创建文件夹失败!请检查权限! {e}") return
时间: 2024-02-20 17:59:31 浏览: 101
这段代码是用来创建两个目录:`pdf_dir`和`txt_dir`,并检查文件夹是否已经存在。如果文件夹不存在,则会创建一个新的文件夹。在这里,`os.makedirs()`方法用于创建文件夹,其中`exist_ok=True`参数表示如果文件夹已经存在则不会报错。如果文件夹创建失败,则会记录错误日志并返回。
如果你想在这段代码后面添加读取PDF文件并将其转换为文本文件的代码,可以使用pdfminer库和Python的os库来实现。以下是示例代码:
```python
import os
from pdfminer.high_level import extract_text
# 遍历pdf_dir文件夹中的所有PDF文件
for filename in os.listdir(pdf_dir):
if filename.endswith('.pdf'):
# 读取PDF文件内容
pdf_path = os.path.join(pdf_dir, filename)
text = extract_text(pdf_path)
# 将文本内容写入txt文件
txt_filename = filename.replace('.pdf', '.txt')
txt_path = os.path.join(txt_dir, txt_filename)
with open(txt_path, 'w', encoding='utf-8') as f:
f.write(text)
```
在这里,`os.listdir()`方法用于获取`pdf_dir`文件夹中的所有文件名。然后通过`if filename.endswith('.pdf'):`语句来筛选出所有PDF文件。使用pdfminer库中的`extract_text()`方法读取PDF文件内容,并将其写入一个同名的txt文件中。你可以根据需要修改txt文件的编码方式和文件名的格式。
阅读全文