python中英文短句统计各单词的词频
时间: 2024-10-19 09:12:35 浏览: 69
python 文本单词提取和词频统计的实例
在Python中,你可以使用`collections`模块的`Counter`类来统计英文短句中每个单词的词频。下面是一个简单的步骤:
1. 首先,你需要对文本进行预处理,去除标点符号并将所有单词转换为小写,以便统一计数。可以使用`string`模块的`punctuation`常量和`str.lower()`方法。
```python
import string
from collections import Counter
def preprocess(text):
# 移除标点符号并转为小写
translator = str.maketrans('', '', string.punctuation)
text = text.translate(translator).lower()
return text.split()
text = "This is a sample sentence. It contains some words that will be counted."
words = preprocess(text)
```
2. 然后,创建`Counter`对象并传入处理后的单词列表。
```python
word_counts = Counter(words)
```
3. 最后,你可以遍历或打印出每个单词及其对应的词频。
```python
for word, count in word_counts.items():
print(f"'{word}': {count}")
```
阅读全文