请思考英文歌曲中的词频统计 1.英文单词的分隔符可以是空格、 标点符号或特殊符号 2.用splitO函数可以拆分字符串,3.逐个读取列表中的单词,如果字典的 生成单词的列表并重复以下的操作。dict1是key单词,value是单词出现的次数
时间: 2024-09-24 13:06:54 浏览: 234
在分析英文歌曲歌词中的词频统计,你可以按照以下步骤操作:
1. 首先,获取歌词文本,这通常是一个字符串,包含歌曲的所有单词。
2. 使用Python的`str.split()` 或者自定义的 `splitO` 函数,将字符串分割成单词列表。这个函数可以根据需求,使用空格、逗号、句号或其他特殊符号作为分隔符。例如:
```python
def splitO(text, delimiter):
return text.replace(',', '').replace('.', '').split(' ')
lyrics = "..." # 替换为实际的歌词字符串
word_list = splitO(lyrics, ' .,!?')
```
3. 创建一个空的字典 `word_count_dict`,用于存储每个单词及其出现的频率,初始值设为键值对 (word, 0):
```python
word_count_dict = {word: 0 for word in word_list}
```
4. 然后遍历这个单词列表,对于列表中的每个单词,检查它是否已经在字典中。如果是,就将其对应的计数加一;如果不是,添加到字典中,并设置计数为1:
```python
for word in word_list:
if word in word_count_dict:
word_count_dict[word] += 1
else:
word_count_dict[word] = 1
```
5. 最后,你就得到了一个词频统计字典,包含了所有出现过的单词以及它们各自出现的次数。
阅读全文