用python写一个文本分析
时间: 2024-05-02 12:22:19 浏览: 85
以下是一个简单的Python文本分析程序,它可以读取文本文件,计算每个单词在文件中出现的次数,并输出最常见的单词及其出现次数。
```python
import re
# 定义读取文件并分析的函数
def analyze_text(filename, n):
with open(filename, 'r') as f:
text = f.read()
words = re.findall(r'\w+', text.lower())
word_count = {}
for word in words:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
top_n_words = sorted(word_count.items(), key=lambda x: x[1], reverse=True)[:n]
return top_n_words
# 使用示例
filename = 'sample_text.txt'
n = 10
top_n_words = analyze_text(filename, n)
for word, count in top_n_words:
print(f'{word}: {count}')
```
在这个示例程序中,我们使用Python的re模块进行单词分割,使用字典来计算每个单词的出现次数,并使用sorted函数和lambda表达式来按照出现次数排序。最后,我们输出最常见的前n个单词及其出现次数。
阅读全文