首页红楼梦中人名词频统计，不使用jieba函数

红楼梦中人名词频统计，不使用jieba函数

时间: 2024-06-18 17:05:53 浏览: 27

红楼梦是一部中国古典小说，其中出现了众多人物。如果不使用jieba函数，我们可以通过Python的字符串处理函数实现人名的词频统计。具体步骤如下： 1. 将红楼梦的文本读入Python中； 2. 对文本进行预处理，包括去除标点符号、将所有字母转为小写等操作； 3. 根据人名的特征（如“贾”、“林”、“史”等姓氏），筛选出可能为人名的字符串； 4. 对筛选出的字符串进行词频统计。以下是一个简单的示例代码，可以实现人名的词频统计： ```python import re # 读入红楼梦文本 with open('红楼梦.txt', 'r', encoding='utf-8') as f: text = f.read() # 预处理文本，去除标点符号、将所有字母转为小写 text = re.sub(r'[^\u4e00-\u9fa5]', '', text) text = text.lower() # 筛选出可能为人名的字符串 name_list = [] for i in range(len(text)): if text[i] == '贾' or text[i] == '史' or text[i] == '王' or text[i] == '薛' or text[i] == '林': name = '' j = i + 1 while j < len(text) and text[j] not in {' ', '\n', '\r'}: name += text[j] j += 1 if len(name) > 1: name_list.append(name) # 统计人名词频 name_freq = {} for name in name_list: if name in name_freq: name_freq[name] += 1 else: name_freq[name] = 1 # 按词频从大到小排序 sorted_name_freq = sorted(name_freq.items(), key=lambda x: x, reverse=True) # 输出前20个人名及其词频 for i in range(20): print(sorted_name_freq[i]) ```

最新推荐

红楼梦中人名词频统计，不使用jieba函数

相关推荐

names.txt（红楼梦人名）

红楼梦词频分析.py

a.rar_人物名称频数统计_红楼梦

python统计红楼梦中人名生成词云

python红楼梦词频统计

python词频统计红楼梦

红楼梦词频统计python代码

用Nltk对红楼梦进行词频统计实验

python分析红楼梦出现的虚词词频统计

用Nltk对红楼梦进行词频统计实验2000字

使用jieba库统计红楼梦中人物

以红楼梦为例分词并统计词频

python红楼梦词频

统计《红楼梦》中主要人物的出场次数

Python红楼梦人物统计

机器学习红楼梦中文文本分析

python用jieba库统计红楼梦中贾宝玉名字出现的次数

红楼梦人物统计编写程序统计红楼梦中前20位出场最多的人物

红楼梦人物出场统计Python

最新推荐

multisim仿真电路实例700例.rar

数据结构课程设计：模块化比较多种排序算法

管理建模和仿真的文件

STM32单片机小车智能巡逻车设计与实现：打造智能巡逻车，开启小车新时代

devc++如何监视

哈夫曼树实现文件压缩解压程序分析

"互动学习：行动中的多样性与论文攻读经历"

STM32单片机小车硬件优化策略：优化硬件设计，让小车更稳定更可靠

android studio购物车源码

数据结构课程设计：电梯模拟与程序实现