python单词统计代码
时间: 2023-05-04 17:04:38 浏览: 139
Python是目前非常流行的编程语言之一,其灵活性和强大的功能使其成为数据科学、人工智能等多个领域的首选。在Python中,可以使用简单的代码实现对文本中单词出现次数的统计,这对于分析文本分布和制定词云图等非常有用。
下面是一个简单的Python代码示例,用于统计文本中单词出现的次数:
```
# 打开文件
file = open("text.txt", "r")
# 创建一个存储单词出现数量的字典
word_count = {}
# 循环遍历文本中的每一行
for line in file:
# 将每一行都转换为单词列表
words = line.strip().split(" ")
# 在单词列表中循环遍历每一个单词
for word in words:
# 将单词转换为小写,去除特殊字符,例如标点符号和空格
word = word.lower().strip(".,?!")
# 检查单词是否已经存在于字典中,如果存在,将计数器加1,否则将单词添加到字典中并将计数器设置为1
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 关闭文件
file.close()
# 循环遍历字典,输出每个单词和它出现的次数
for word, count in word_count.items():
print(word, count)
```
上述代码的基本思路是遍历文本中的每一个单词,并使用字典记录每个单词出现的次数。具体来说,代码首先打开文件并创建一个空的字典。然后循环遍历文本中的每一行,将每一行都分割为单词列表。接着在单词列表中循环遍历每一个单词,并对每个单词进行清洗和处理。最后,对字典进行遍历,输出每个单词和它出现的次数。
这个代码示例虽然简单,但它可以作为一个基础版本,可以通过添加更多的功能来实现更复杂的单词统计分析。例如,可以使用正则表达式来处理更复杂的文本清洗工作,并将单词出现的频率以图表的形式展示出来,以进一步分析单词在文本中的分布情况。无论用于哪种用途,这个Python单词统计代码都可以作为入门者学习Python编程的良好基础。
阅读全文