从xml文件和jpg的混合文件夹中获取xml对应的jpg文件 python
时间: 2024-12-23 08:25:08 浏览: 6
在Python中,你可以使用os模块来遍历文件夹,然后结合BeautifulSoup库解析XML文件来找到对应的图片文件名。以下是一个简单的步骤说明:
1. 导入必要的库:
```python
import os
from bs4 import BeautifulSoup
```
2. 定义函数来查找对应关系:
```python
def get_jpg_from_xml(xml_folder, xml_file, jpg_folder):
# 假设xml和jpg文件在同一目录下,如果不是请修改路径逻辑
with open(os.path.join(xml_folder, xml_file), 'r') as f:
soup = BeautifulSoup(f, 'xml') # 使用xml作为解析器
for img_tag in soup.find_all('img'): # 假设标签名为<img>
img_filename = img_tag.get('src')
if img_filename.endswith('.jpg'):
yield os.path.join(jpg_folder, img_filename)
```
3. 调用函数并处理结果:
```python
xml_folder = 'path/to/xml/folder'
jpg_folder = 'path/to/jpeg/folder'
for xml_file in os.listdir(xml_folder):
if xml_file.endswith('.xml'): # 过滤出.xml文件
for jpg_path in get_jpg_from_xml(xml_folder, xml_file, jpg_folder):
print(f'XML file: {xml_file} corresponds to JPG file: {jpg_path}')
```
这个示例假设XML文件中的`<img>`标签有`src`属性表示图片文件路径,并且所有.jpg文件都在同一层次的子目录中。
阅读全文