python文本数据分析代码
时间: 2023-07-03 16:28:16 浏览: 95
以下是一个简单的 Python 文本数据分析代码,它可以读取一个文本文件,计算其中每个单词出现的次数,并输出出现次数最高的前十个单词及其出现次数:
```python
# 导入必要的库
import re
from collections import Counter
# 读取文本文件
with open('text_file.txt', 'r') as f:
text = f.read()
# 去除标点符号和换行符
text = re.sub(r'[^\w\s]', '', text)
text = text.replace('\n', ' ')
# 将文本分割成单词列表
words = text.lower().split()
# 计算每个单词出现的次数
word_counts = Counter(words)
# 输出出现次数最高的前十个单词及其出现次数
top_words = word_counts.most_common(10)
for word, count in top_words:
print(f'{word}: {count}')
```
需要注意的是,这只是一个简单的示例代码,实际的文本数据分析可能需要更加复杂的处理和算法。
阅读全文