建立自定义英文词频统计函数,实现英文词频统计和插入特殊字符和,并返回词频字典
时间: 2024-02-28 14:52:40 浏览: 68
英文文本单词词频统计(C++实现)
5星 · 资源好评率100%
好的,我可以为您编写一个简单的英文词频统计函数。以下是代码:
```python
import string
def word_frequency(text):
# 将文本中的所有标点符号去除,并转换成小写字母
text = text.translate(str.maketrans('', '', string.punctuation)).lower()
# 将文本按照空格分割成单词列表
words = text.split()
# 定义一个词频字典
frequency = {}
# 遍历每一个单词,统计词频
for word in words:
if word in frequency:
frequency[word] += 1
else:
frequency[word] = 1
return frequency
```
该函数接收一个字符串参数,该字符串为要进行词频统计的文本。函数首先将文本中的所有标点符号去除,并将所有字母转换成小写字母。然后将文本按照空格分割成单词列表,并遍历每一个单词,统计词频。最后返回一个词频字典,其中每个键表示一个单词,每个值表示该单词在文本中出现的次数。
如果您想要在统计词频时插入特殊字符,可以在文本中插入这些特殊字符,然后传入修改后的文本进行统计。例如,如果您想要在文本中插入字符“#”,可以将文本中的每个单词后面都添加一个“#”,然后再进行词频统计。
注意,该函数只适用于英文文本,如果您需要处理其他语言的文本,需要对函数进行相应的修改。
阅读全文