定义一个关键词列表,例如“贾宝玉”,“宝玉”,“宝钗”,“黛玉”,“林妹妹”等,统计HLM.txt 文件中任两个关键词共现的行数,并将这些行内容写入到一个新文件
时间: 2024-05-10 14:15:27 浏览: 156
统计关键词程序.txt
假设HLM.txt文件中包含了《红楼梦》的文本,我们可以使用Python来完成这个任务。代码如下:
```python
keywords = ["贾宝玉", "宝玉", "宝钗", "黛玉", "林妹妹"]
# 统计关键词共现的行数
lines = []
with open("HLM.txt", "r", encoding="utf-8") as f:
for line in f:
if any(keyword in line for keyword in keywords):
lines.append(line)
# 将这些行内容写入到一个新文件
with open("co-occurrence.txt", "w", encoding="utf-8") as f:
f.writelines(lines)
```
解释一下代码:
首先,我们定义了一个关键词列表,其中包含了几个《红楼梦》中的重要人物。
接着,我们打开HLM.txt文件,并逐行读取文件内容。对于每一行,我们使用any函数判断该行是否包含了关键词列表中的任意一个关键词。如果包含了,我们就将该行添加到一个列表中。
最后,我们打开一个新文件co-occurrence.txt,并将上一步中得到的所有行内容写入到该文件中。注意,我们使用了writelines函数,该函数可以将一个字符串列表直接写入到文件中。
阅读全文