写一个python文本分析代码
时间: 2024-01-31 22:04:45 浏览: 56
Python文本分析
下面是一个简单的Python文本分析代码,用于计算一个文本中每个单词出现的频率。
```python
import re
# 读取文本文件
with open('text.txt', 'r') as file:
text = file.read()
# 去除标点符号和换行符
text = re.sub(r'[^\w\s]', '', text)
text = re.sub(r'\n', ' ', text)
# 转换为小写字母
text = text.lower()
# 分割文本为单词列表
words = text.split()
# 计算每个单词的出现频率
word_count = {}
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 按照出现频率排序
word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
# 输出结果
for word, count in word_count:
print(word, count)
```
这段代码的作用是读取一个文本文件,去除标点符号和换行符,将所有单词转换为小写字母,并统计每个单词出现的频率。最后按照单词出现频率排序,并输出结果。你可以根据自己的需求进行修改和扩展。
阅读全文