Python哈利波特
时间: 2023-12-14 15:33:45 浏览: 168
根据提供的引用内容,我们可以了解到《哈利波特》是一部关于哈利、赫敏、罗恩等人在大法师邓布利多的帮助下,使用魔法抵抗伏地魔的故事。同时,根据引用和引用,我们可以使用Python对小说中的人物名字和出现频率进行统计和分析。
以下是Python代码示例:
1. 统计人物名字TOP20的词语
```python
import jieba
import pandas as pd
from collections import Counter
from pyecharts import Bar
# 读取小说文本
with open('harry_potter.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 统计人物名字出现的次数
names = ['哈利', '赫敏', '罗恩', '邓布利多', '马尔福', '斯内普', '小天狼星']
names_count = Counter([word for word in words if word in names])
# 绘制柱状图
bar = Bar('主要人物Top20', background_color='white', title_pos='center', title_text_size=20)
x = names_count.most_common(20)
bar.add('', [i[0] for i in x], [i[1] for i in x], xaxis_interval=0, xaxis_rotate=30, is_label_show=True)
bar.render()
```
2. 统计整部小说出现最多的词语TOP15
```python
import jieba
import pandas as pd
from collections import Counter
# 读取小说文本
with open('harry_potter.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 统计词语出现的次数
words_count = Counter(words)
# 去除停用词
stopwords = pd.read_csv('stopwords.txt', index_col=False, quoting=3, sep='\t', names=['stopword'], encoding='utf-8')
words = [word for word in words if word not in stopwords]
# 统计出现最多的词语TOP15
top15 = words_count.most_common(15)
print(top15)
```
阅读全文