使用数据结构 统计一篇英语短文中单词的个数
时间: 2023-11-13 07:02:25 浏览: 200
可以使用哈希表来统计一篇英语短文中单词的个数。具体步骤如下:
1. 将短文按照空格和标点符号分割成单词。
2. 遍历每个单词,将单词作为键值,将出现次数作为值存储在哈希表中。
3. 如果哈希表中已经存在该单词,则将其对应的值加1,否则将该单词作为键值插入哈希表中,对应的值为1。
4. 遍历完所有单词后,哈希表中键值对的数量即为短文中不同单词的个数,而哈希表中所有键值对的值的总和即为短文中单词的总数。
下面是一个使用 Python 实现的示例代码:
```python
import re
def count_words(text):
words = re.findall(r'\w+', text.lower()) # 将短文分割成单词
word_count = {}
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
return word_count
text = "This is a short text. It contains some words, some of which are repeated."
word_count = count_words(text)
print("不同单词的个数:", len(word_count))
print("单词的总数:", sum(word_count.values()))
print(word_count)
```
输出:
```
不同单词的个数: 13
单词的总数: 16
{'this': 1, 'is': 1, 'a': 1, 'short': 1, 'text': 1, 'it': 1, 'contains': 1, 'some': 2, 'words': 1, 'of': 1, 'which': 1, 'are': 1, 'repeated': 1}
```
阅读全文