phython读取文本文件中的内容,统计其频率最高的10个单词,将结果写入CSV文件中
时间: 2024-02-27 13:58:50 浏览: 69
好的,我可以帮你解决这个问题。你可以使用Python中的collections模块来实现单词频率的统计。具体的实现步骤如下:
1. 首先,你需要打开文本文件并读取其中的内容。可以使用Python中的open()函数和read()方法实现。
```python
with open('file.txt', 'r') as f:
text = f.read()
```
2. 接着,你需要将读取的文本内容进行分词,可以使用Python中的nltk库或者jieba库实现。这里以nltk为例:
```python
import nltk
tokens = nltk.word_tokenize(text.lower())
```
3. 然后,你可以使用collections模块中的Counter类对单词进行统计,并取出频率最高的前10个单词。
```python
from collections import Counter
word_count = Counter(tokens)
top_words = word_count.most_common(10)
```
4. 最后,你可以将统计结果写入CSV文件中,可以使用Python中的csv库实现。
```python
import csv
with open('result.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['Word', 'Frequency'])
for word, count in top_words:
writer.writerow([word, count])
```
以上就是Python读取文本文件中的内容,统计其频率最高的10个单词,并将结果写入CSV文件中的完整代码。
阅读全文