从doc文件中抽取含有多个特定关键词的句子,并保存到txt文件,直接写python代码
时间: 2023-02-05 20:00:36 浏览: 102
使用python对多个txt文件中的数据进行筛选的方法
可以使用Python中的docx模块来读取doc文件,然后遍历文件中的所有段落,并检查是否包含所需的关键词。如果是,则将该段落写入txt文件。这是一个示例代码:
```
import docx
# 打开doc文件
doc = docx.Document("file.docx")
# 创建txt文件
txt_file = open("output.txt", "w")
# 遍历所有段落
for para in doc.paragraphs:
# 检查是否包含关键词
if "关键词1" in para.text or "关键词2" in para.text:
# 将段落写入txt文件
txt_file.write(para.text)
# 关闭txt文件
txt_file.close()
```
在这个示例中,我们检查每个段落是否包含"关键词1"或"关键词2"。如果是,则将该段落写入txt文件。你可以替换这些关键词为你想要的任何关键词。
阅读全文