写一段python脚本,检索一个文件夹中所有docx文档中的“燃气”字段,并输出该字段所在的文件名与这个字段所在的段落文字
时间: 2024-12-01 17:30:18 浏览: 19
在Python中,你可以使用`python-docx`库来读取`.docx`文件并提取指定内容。首先,需要安装这个库,如果尚未安装,可以运行`pip install python-docx`。下面是一个简单的脚本示例,它遍历指定文件夹内的所有`.docx`文件,查找包含"燃气"关键词的段落:
```python
import os
from docx import Document
# 指定要搜索的文件夹路径
folder_path = 'your_folder_path'
search_term = '燃气'
def find燃气_in_doc(doc_path):
document = Document(doc_path)
for paragraph in document.paragraphs:
if search_term in paragraph.text:
print(f"'燃气' found in file: {doc_path}, paragraph text: {paragraph.text}")
# 遍历文件夹并处理每个.docx文件
for filename in os.listdir(folder_path):
if filename.endswith('.docx'):
full_file_path = os.path.join(folder_path, filename)
find_gas_in_doc(full_file_path)
相关问题
写一段python脚本,检索一个文件夹中所有docx文档中的“燃气”字段,并输出该字段所在的文件名(不用输出完整路径)与这个字段所在的段落文字
为了完成这个任务,我们可以使用Python的`os`模块来遍历文件夹,`python-docx`库来读取`.docx`文档,然后搜索指定的关键字。这是一个简单的示例:
```python
import os
from docx import Document
folder_path = 'your_folder_path' # 替换为实际的文件夹路径
keyword = '燃气'
for foldername, subfolders, filenames in os.walk(folder_path):
for filename in filenames:
if filename.endswith('.docx'):
file_path = os.path.join(foldername, filename)
doc = Document(file_path)
for paragraph in doc.paragraphs:
if keyword in paragraph.text:
print(f"文件名: {filename}, 关键词'{keyword}'位于段落:\n{paragraph.text}")
#
阅读全文