如何用Python将文件名从文件夹中提取并写入Excel表格?
时间: 2024-10-27 13:07:25 浏览: 93
在Python中,我们可以使用pandas库和os库来实现这个功能。首先,你需要安装这两个库,如果没有安装可以使用`pip install pandas`和`pip install os`命令。以下是一个简单的步骤示例:
```python
import os
import pandas as pd
# 定义要遍历的文件夹路径
folder_path = 'your_folder_path'
# 创建一个空列表来存储文件名
file_names = []
# 遍历文件夹中的所有文件
for filename in os.listdir(folder_path):
# 只保留非隐藏文件(如'.txt', '.jpg'等),可以根据需要修改条件
if not filename.startswith('.'):
file_names.append(filename)
# 将文件名转换成DataFrame
df = pd.DataFrame({'File Name': file_names})
# 写入Excel文件
output_file = 'file_names_from_folder.xlsx'
df.to_excel(output_file, index=False)
相关问题
python读取D盘的所有文件夹,提取所有doc结尾的文件名到excel表格
Python中,我们可以使用`os`模块来遍历文件夹并查找特定类型的文件。以下是一个示例,展示如何读取D盘根目录下的所有`.doc`文件并将它们的文件名写入Excel表格:
首先,安装必要的库,如果还没有安装的话:
```bash
pip install pandas openpyxl
```
然后,编写脚本以实现此功能[^1]:
```python
import os
import pandas as pd
# 定义要搜索的文件夹路径
folder_path = "D:\\"
# 使用os.walk遍历文件夹及其子文件夹
for root, dirs, files in os.walk(folder_path):
# 检查文件扩展名为'.doc'
doc_files = [file for file in files if file.endswith('.doc')]
# 如果找到.doc文件,收集文件名
if doc_files:
# 创建一个DataFrame存储文件名
df = pd.DataFrame({'File': doc_files})
# 将数据写入Excel文件,假设输出文件为'doc_files.xlsx'
df.to_excel('doc_files.xlsx', index=False)
print(f"已将.DOC文件名写入Excel表格'doc_files.xlsx'")
帮我写一个python程序,从文件夹中的word文档中提取关键信息到excel
好的,我可以回答这个问题。您可以使用Python中的docx和openpyxl库来实现这个功能。您需要先安装这两个库,然后使用以下代码:
```python
import os
import docx
from openpyxl import Workbook
# 创建一个Excel工作簿
wb = Workbook()
ws = wb.active
# 设置表头
ws['A1'] = '文件名'
ws['B1'] = '关键信息'
# 遍历文件夹中的所有Word文档
folder_path = '文件夹路径'
for filename in os.listdir(folder_path):
if filename.endswith('.docx'):
# 打开Word文档
doc = docx.Document(os.path.join(folder_path, filename))
# 提取关键信息
key_info = ''
for para in doc.paragraphs:
if '关键词' in para.text:
key_info = para.text.split('关键词')[1].strip()
break
# 将文件名和关键信息写入Excel表格
row = (filename, key_info)
ws.append(row)
# 保存Excel文件
wb.save('关键信息.xlsx')
```
请注意,您需要将“文件夹路径”替换为您的实际文件夹路径,并将“关键词”替换为您要提取的关键词。此外,您还可以根据需要修改Excel表格的表头和列数。
阅读全文