python统计文本中英文、符号
时间: 2024-10-25 11:07:10 浏览: 23
python过滤中英文标点符号的实例代码
在Python中,可以使用内置的`collections`模块以及正则表达式库`re`来统计文本中英文单词的数量以及特殊字符(包括标点符号)的总数。以下是一个简单的示例:
```python
import re
from collections import Counter
def count_text_elements(text):
# 使用正则表达式匹配英文单词和非字母数字字符
words = re.findall(r'\b\w+\b', text) # 匹配单词
punctuation = re.findall(r'[^\w\s]', text) # 匹配所有非字母和空格字符
# 使用Counter计算每个列表中元素的频率
word_count = Counter(words)
punctuation_count = Counter(punctuation)
return word_count, punctuation_count
# 示例文本
text = "Hello, world! This is a sample text with some symbols like @ and #."
# 统计并打印结果
word_stats, punctuation_stats = count_text_elements(text)
print(f"英文单词数量: {word_stats}")
print(f"特殊字符数量: {punctuation_stats}")
阅读全文