使用Python对文本文件中单词进行统计,去除末尾\n
时间: 2024-05-08 09:20:05 浏览: 59
你可以使用python的文件操作和字符串处理来对文本文件中的单词进行统计和处理。具体步骤如下:
1. 打开文本文件,并读取文件中的内容到一个字符串中。
```
with open('filename.txt', 'r') as f:
content = f.read()
```
2. 使用正则表达式或字符串操作对字符串进行处理,去除末尾的换行符和标点等符号,并将字符串划分成单词列表。
```
import re
# 去除换行符和标点符号
content = re.sub(r'[\n\.,;!?:]', '', content)
# 分割成单词列表
words = content.split()
```
3. 对单词列表进行统计,可以使用python内置的collections模块中的Counter类来实现。
```
from collections import Counter
# 对单词列表进行统计
word_count = Counter(words)
# 输出统计结果
for word, count in word_count.most_common():
print(word, count)
```
这样就可以统计出文本文件中单词的出现次数了。
阅读全文