读取文件夹下所有XML文件,并且转换成EXCEL
时间: 2024-10-25 13:17:38 浏览: 27
Python实现提取XML内容并保存到Excel中的方法
5星 · 资源好评率100%
在Python中,可以使用`os`, `xml.etree.ElementTree`以及`pandas`库来读取文件夹下的所有XML文件并将其转换为Excel文件。下面是一个基本的步骤:
1. 导入必要的库:
```python
import os
import xml.etree.ElementTree as ET
import pandas as pd
```
2. 定义函数来解析XML文件并将数据存储在一个字典或列表中:
```python
def parse_xml(file_path):
data = []
tree = ET.parse(file_path)
root = tree.getroot()
for item in root.findall('./*'):
row_data = {attr.tag: attr.text for attr in item.attrib}
data.append(row_data)
return data
```
3. 遍历文件夹,读取每个XML文件并处理数据:
```python
def process_folder(input_folder, output_excel_file):
data_list = []
for filename in os.listdir(input_folder):
if filename.endswith(".xml"):
file_path = os.path.join(input_folder, filename)
parsed_data = parse_xml(file_path)
data_list.extend(parsed_data)
# 将数据列表转换为DataFrame并保存到Excel文件
df = pd.DataFrame(data_list)
df.to_excel(output_excel_file, index=False)
```
4. 调用函数并指定输入文件夹和输出Excel文件路径:
```python
input_folder = "path/to/xml/folder"
output_excel_file = "output.xlsx"
process_folder(input_folder, output_excel_file)
```
阅读全文