写一个读取文本关键词的程序
时间: 2024-06-09 10:10:22 浏览: 8
好的,这里提供一个Python的示例程序:
```python
import re
def extract_keywords(file_path, num_keywords):
# 读取文本内容
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
# 去除标点符号和数字
content = re.sub('[^\w\s]', '', content)
content = re.sub('\d+', '', content)
# 分词并统计词频
words = content.lower().split()
freq_dict = {}
for word in words:
freq_dict[word] = freq_dict.get(word, 0) + 1
# 按词频排序并输出前num_keywords个关键词
sorted_freq = sorted(freq_dict.items(), key=lambda x: x[1], reverse=True)
keywords = [x[0] for x in sorted_freq[:num_keywords]]
return keywords
```
这个程序可以读取指定文件的文本内容,并提取出其中出现频率最高的关键词。它的大致思路如下:
1. 读取文本内容;
2. 去除标点符号和数字;
3. 分词并统计词频;
4. 按词频排序,并输出前num_keywords个关键词。
你可以根据实际需求调整程序中的参数。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)