python中统计文本中各类符号的出现次数,用字典变量记录,打印出现次数最高的前5个词,每个词一行
时间: 2024-03-07 17:46:43 浏览: 182
python项目实例代码源码-用Python分析文本数据的词频.zip
好的,可以使用Python中的正则表达式和字典来实现。下面是一个示例代码:
```python
import re
# 打开文件并读取内容
with open('text.txt', 'r') as f:
text = f.read()
# 使用正则表达式查找所有非字母数字符号
pattern = re.compile(r'[^\w\s]')
matches = pattern.findall(text)
# 统计符号出现次数
symbol_count = {}
for match in matches:
if match in symbol_count:
symbol_count[match] += 1
else:
symbol_count[match] = 1
# 打印出现次数最高的前5个符号
for symbol, count in sorted(symbol_count.items(), key=lambda x: x[1], reverse=True)[:5]:
print(symbol, count, sep='\t')
```
在这个示例中,我们首先打开一个文本文件并读取其中的内容。然后使用正则表达式查找所有非字母数字符号,并将其存储在一个列表中。接下来,我们遍历列表并使用字典来统计每个符号出现的次数。最后,我们使用sorted函数将字典按值排序,并打印出现次数最高的前5个符号。
阅读全文