水浒传jieba找人名
时间: 2023-11-27 07:46:22 浏览: 44
以下是使用jieba库在水浒传小程序源码中找人名的示例代码:
```python
import jieba
# 读取小说文本
with open('shuihuzhuan.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba进行分词
words = jieba.lcut(text)
# 找出所有的人名
names = []
for i in range(len(words)-1):
if words[i] == '宋江' or words[i] == '及时雨':
names.append(words[i])
elif words[i+1] == '宋江' or words[i+1] == '及时雨':
names.append(words[i]+words[i+1])
# 去重
names = list(set(names))
# 输出结果
print(names)
```
运行以上代码,可以找出水浒传中所有的人名,并输出结果。
相关问题
水浒传文本分析python
水浒传是中国古代四大名著之一,也是一部非常经典的文学作品。如果你想进行水浒传文本分析的话,可以使用Python编程语言来实现。以下是一些常用的Python库和技术,可以帮助你进行水浒传文本分析:
1. 文本读取:使用Python内置的文件操作函数,如open()函数,可以读取水浒传的文本文件。
2. 文本预处理:使用Python的字符串处理函数和正则表达式库,如re模块,可以对文本进行清洗、分词、去除停用词等预处理操作。
3. 文本统计:使用Python的collections库中的Counter类,可以统计文本中词频最高的词语或者字符。
4. 情感分析:使用Python的自然语言处理库,如NLTK或者spaCy,可以进行情感分析,判断文本中的情感倾向。
5. 关键词提取:使用Python的关键词提取库,如jieba库或者TextRank算法,可以提取文本中的关键词。
6. 主题建模:使用Python的主题建模库,如gensim或者LDA算法,可以对水浒传文本进行主题分析,找出其中隐藏的主题。
7. 可视化展示:使用Python的数据可视化库,如matplotlib或者seaborn,可以将分析结果以图表形式展示,更直观地呈现分析结果。
以上是一些常用的Python技术和库,可以帮助你进行水浒传文本分析。如果你有具体的问题或者需要更详细的介绍,请告诉我。
水浒传词频统计python
以下是使用Python进行《水浒传》词频统计的示例代码:
```python
import jieba
from collections import Counter
# 读取文本文件
with open('input水浒传.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 去除停用词
stopwords = ['的', '了', '和', '是', '在', '他', '她', '它'] # 停用词列表,可以根据实际情况进行修改
filtered_words = [word for word in words if word not in stopwords]
# 统计词频
word_count = Counter(filtered_words)
# 输出词频结果
for word, count in word_count.most_common(10): # 只输出频率最高的10个词语
print(word, count)
```
这段代码首先使用jieba库对文本进行分词,然后去除停用词,最后使用Counter类统计词频。最后,我们输出频率最高的10个词语及其出现次数。