如果有PDF文件混在一起,如何区分并只转换CAJ文件?
时间: 2024-09-22 18:03:18 浏览: 36
如果你的文件夹里有CAJ和PDF文件混合,可以在Python脚本中添加一个简单的条件判断来过滤出CAJ文件。例如,你可以使用`os.path.splitext()`函数获取文件扩展名,然后检查是否等于`.caj`:
```python
import os
from caj import CAJ
source_folder = '你的文件夹路径'
target_folder = '你的目标文件夹路径'
for filename in os.listdir(source_folder):
if filename.endswith(('.caj', '.CAJ')): # 检查是否为CAJ文件
file_extension = os.path.splitext(filename)[1]
if file_extension == '.caj':
caj_file = CAJ(os.path.join(source_folder, filename))
txt_content = caj_file.convert_to_text()
new_filename = filename.replace(file_extension, '.txt')
with open(os.path.join(target_folder, new_filename), 'w', encoding='utf-8') as f:
f.write(txt_content)
```
这里我们不仅检查了`.caj`,还检查了大小写的`.CAJ`,以防文件名大小写不一致的情况。
阅读全文