python文本分析统计字符
时间: 2024-09-09 10:11:25 浏览: 56
python统计文本字符串里单词出现频率的方法
5星 · 资源好评率100%
在Python中,对文本进行字符分析统计通常涉及到读取文件、处理文本内容并计算字符频率。你可以使用内置的`collections`模块中的`Counter`类来方便地完成这项任务。下面是一个基本的例子:
```python
import string
from collections import Counter
def text_analysis(text_file):
with open(text_file, 'r', encoding='utf-8') as file:
content = file.read().lower() # 将所有字符转为小写
# 移除非字母数字字符
content = ''.join(c for c in content if c.isalnum())
char_counts = Counter(content)
most_common_chars = char_counts.most_common(10) # 获取最常见的前10个字符及其计数
return most_common_chars
# 使用函数
text_stats = text_analysis('example.txt')
for char, count in text_stats:
print(f"字符 '{char}' 出现了 {count} 次")
阅读全文