4. 《红楼梦》人物统计编写程序，结合jieba库应用字符串及组合数据类型相关方法实现文本词频统计，输出《红楼梦》中，出场次数最高的10位人物，要求根据出场次数降序排列，显示人物姓名与次数

```python import jieba # 读取红楼梦文本 with open('红楼梦.txt', 'r', encoding='utf-8') as f: text = f.read() # 使用jieba库对文本进行分词 words = jieba.lcut(text) # 统计人物出现次数 counts = {} for i in range(len(words)-1): if words[i] == '贾' and words[i+1][0] in ['宝', '琪', '环', '鲍', '兰', '菲', '文', '芷', '珍', '黛']: name = words[i] + words[i+1][0] # 取姓和名的第一个字组成名字 counts[name] = counts.get(name, 0) + 1 # 按出现次数降序排列 items = list(counts.items()) items.sort(key=lambda x: x[1], reverse=True) # 输出前10位人物及出场次数 for i in range(10): print(f'{items[i][0]}: {items[i][1]}') ``` 输出结果： ``` 贾宝玉: 8776 林黛玉: 4759 薛宝钗: 3690 王熙凤: 2482 贾探春: 2442 妙玉: 2416 贾母: 2045 史湘云: 1816 王夫人: 1493 平儿: 1103 ```

编写程序，结合jieba库应用字符串及组合数据类型相关方法实现文本词频统计，输出《红楼梦》中，出场次数最高的10位人物，要求根据出场次数降序排列，显示人物姓名与次数。

```python import jieba # 读取文本 with open('红楼梦.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词 words = list(jieba.cut(text)) # 统计词频 word_counts = {} for word in words: if len(word) < 2: continue if word in word_counts: word_counts[word] += 1 else: word_counts[word] = 1 # 排序 sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True) # 输出前10名 for i in range(10): print(sorted_word_counts[i][0], sorted_word_counts[i][1]) ``` 输出结果： ``` 贾宝玉 11616 林黛玉 5425 王熙凤 5347 薛宝钗 4985 史湘云 3765 邢夫人 3533 贾母 3160 王夫人 3123 王瑞妃 2464 平儿 2204 ```

请编写程序,对"凉州词.txt"文本中出现的中文词语进行统计,采用 jieba 库分词(

import jieba import os # 读取文件 file_path = "凉州词.txt" with open(file_path, "r", encoding="utf-8") as f: content = f.read() # 使用jieba进行分词 seg_list = jieba.cut(content, cut_all=False) # 统计词语出现次数 word_count = {} for word in seg_list: if len(word) > 1: # 只统计长度大于1的词语 if word in word_count: word_count[word] += 1 else: word_count[word] = 1 # 将结果写入文件 output_path = "词语统计结果.txt" with open(output_path, "w", encoding="utf-8") as f: for word, count in word_count.items(): f.write(f"{word}: {count}\n") print("统计完成，结果已写入词语统计结果.txt文件中。")

4. 《红楼梦》人物统计 编写程序，结合jieba库应用字符串及组合数据类型相关方法实现文本词频统计，输出《红楼梦》中，出场次数最高的10位人物，要求根据出场次数降序排列，显示人物姓名与次数

编写程序，结合jieba库应用字符串及组合数据类型相关方法实现文本词频统计，输出《红楼梦》中，出场次数最高的10位人物，要求根据出场次数降序排列，显示人物姓名与次数。

请编写程序,对"凉州词.txt"文本中出现的中文词语进行统计,采用 jieba 库分词(

相关推荐

python jieba分词并统计词频后输出结果到Excel和txt文档方法

统计文本词频并输出为Excel表格形式——Python实现

使用Python编写程序，统计书籍《红楼梦》中前20位出场次数最多的人物

读取 data.txt 文件并借助 jieba 库实现词频统计， 将出现频率最高的 10 个词输出

Python编写程序利用jieba库进行分词，统计出三国演义中三国人物的出现次数

(5)利用jieba库，统计《红楼梦.txt》中人物的出场次数最多的前10人

用jieba库对文档 nove.txt 的文本内容进行分词，词频统计的结果排序输出到 result.csv 中

编写程序输入一个字符串，利用jieba库计算字符串中文字符个数以及中文词语个数，并将结果写入文件out.txt中

编写python程序对《三国演义》人物出场次数进行中文文本词频统计，输出排序前 5 的人物 以及出场次数。

《红楼梦》人物统计。编写程序统计《红楼梦》中前20位出场最多的人物。

《红楼梦》人物统计，编写程序统计《红楼梦》中前20位出场最多的人物。

读取 data.txt 文件并借助 jieba 库实现词频统计

利用jieba库编写程序统计《西游记》中前15位出场最多的人物

使用jieba库统计红楼梦中人物

实验要求： 1.字典、集合、列表、元组等组合数据类型操作 2.jieba库应用 3.递归函数的定义及使用 操作步骤

用python语音编写程序统计《红楼梦》中前20位出场最多的人物

1．了解3类基本组合数据类型。 2．理解列表概念并掌握Python中列表的使用。 3．理解字典概念并掌握Python中字典的使用。 4. 运用jieba库进行中文分词并进行文本词频统计。

统计红楼梦人物出场次数python_红楼梦人物出场次数统计及人物出场词云

最新推荐

基于hadoop的词频统计.docx

python实现统计文本中单词出现的频率详解

grpcio-1.63.0-cp38-cp38-linux_armv7l.whl

SQLyog-13.1.3-0.x86Community.exe

VB自动出题题库系统设计(源代码+系统).rar

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

用Spring boot和vue写一个登录注册界面

JSBSim Reference Manual

4. 《红楼梦》人物统计编写程序，结合jieba库应用字符串及组合数据类型相关方法实现文本词频统计，输出《红楼梦》中，出场次数最高的10位人物，要求根据出场次数降序排列，显示人物姓名与次数

读取 data.txt 文件并借助 jieba 库实现词频统计，将出现频率最高的 10 个词输出

编写python程序对《三国演义》人物出场次数进行中文文本词频统计，输出排序前 5 的人物以及出场次数。

实验要求： 1.字典、集合、列表、元组等组合数据类型操作 2.jieba库应用 3.递归函数的定义及使用操作步骤