从doc文件中抽取含有多个特定关键词的句子,并只保存这些含有关键词的句子到txt文件,直接写python代码
时间: 2023-02-05 11:00:36 浏览: 135
这是一个示例代码,你可以根据你的需求进行修改:
```
import docx
def extract_sentences(doc_path, keywords, txt_path):
# 打开文档
doc = docx.Document(doc_path)
# 创建空列表来存储句子
sentences = []
# 遍历文档中的每一个段落
for paragraph in doc.paragraphs:
# 遍历段落中的每一个句子
for sentence in paragraph.text.split('.'):
# 判断句子是否包含所有的关键词
if all(keyword in sentence for keyword in keywords):
# 如果是,将句子加入列表
sentences.append(sentence)
# 将句子写入txt文件
with open(txt_path, 'w') as f:
for sentence in sentences:
f.write(sentence + '\n')
# 使用示例
extract_sentences('doc_file.docx', ['keyword1', 'keyword2'], 'sentences.txt')
```
上面的代码打开了一个docx文件,然后遍历文档中的每一个段落和句子,并检查句子是否包含所有的关键词。如果是,则将句子加入到列表中。最后,代码将列表中的句子写入一个txt文件。
阅读全文