文本词频统计,Hamlet英文词频统计以及《三国演义》人物出场统计。
时间: 2023-09-13 10:12:41 浏览: 51
好的,我可以帮您完成这些任务。
首先是文本词频统计。您需要提供一个文本文件,然后我可以帮您统计其中每个单词出现的次数。以下是一个Python示例代码:
```python
# 打开文件并读取内容
with open('your_file_name.txt', 'r') as f:
text = f.read()
# 将文本转换为小写字母,以便单词不区分大小写
text = text.lower()
# 去掉所有标点符号和换行符
punctuation = '''!()-[]{};:'"\,<>./?@#$%^&*_~\n'''
for char in punctuation:
text = text.replace(char, ' ')
# 将文本分割成单词列表
words = text.split()
# 统计每个单词出现的次数
word_count = {}
for word in words:
if word not in word_count:
word_count[word] = 0
word_count[word] += 1
# 按出现频率从高到低排序
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
# 输出前20个最常出现的单词
for word, count in sorted_word_count[:20]:
print(word, count)
```
接下来是Hamlet英文词频统计。您可以在网上找到Hamlet的文本文件,然后使用上述代码进行词频统计。
最后是《三国演义》人物出场统计。同样,您需要提供《三国演义》的文本文件。以下是一个Python示例代码:
```python
# 打开文件并读取内容
with open('your_file_name.txt', 'r') as f:
text = f.read()
# 去掉所有换行符
text = text.replace('\n', '')
# 定义人物列表
characters = ['刘备', '曹操', '孙权', '诸葛亮', '周瑜', '魏延', '张飞', '关羽', '赵云', '张辽']
# 统计每个人物出现的次数
character_count = {}
for character in characters:
count = text.count(character)
character_count[character] = count
# 按出现次数从高到低排序
sorted_character_count = sorted(character_count.items(), key=lambda x: x[1], reverse=True)
# 输出出现次数最多的前10个人物
for character, count in sorted_character_count[:10]:
print(character, count)
```
希望这些代码可以帮到您!如果还有其他问题,请随时问我。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)