python如何打开一个word文档,遍历所有内容,查找关键字"第一章",并以此断开为两部分,保存到一个字典数据,请给出代码
时间: 2024-05-14 21:15:44 浏览: 87
用Python做文本处理第一章.doc
以下是使用python-docx模块获取Word文档中指定关键字的方法:
```python
import docx
def read_word_doc(file_path, keyword):
# 打开Word文档
doc = docx.Document(file_path)
# 遍历所有段落
is_find = False
result = {'part1': '', 'part2': ''}
for para in doc.paragraphs:
if not is_find:
# 如果没找到关键字,继续查找
if keyword in para.text:
is_find = True
else:
# 如果找到关键字,把这一段之前的文本保存到part1
result['part1'] += para.text
# 如果遇到下一个关键字,把这一段之后的文本保存到part2
if keyword in para.text:
result['part2'] += para.text
break
result['part1'] += '\n'
return result
```
以上代码中,首先从文件路径读取Word文档,然后遍历所有段落,如果在文本中找到了关键字,就将之前的文本保存在字典的part1中,然后在找到下一个关键字之前,将文本保存在part2中。最后返回整个字典数据。
阅读全文