jieba分词统计人物
时间: 2023-11-17 09:45:03 浏览: 110
jieba分词可以用于统计人物。在给定的示例代码中,使用jieba分词的精确模式对文本进行分词,并通过条件语句将某些词语统一替换为特定的人物名称。然后使用字典counts来统计每个人物出现的次数。最后按出现次数从大到小进行排序,并输出前10个出现次数最多的人物。
需要注意的是,示例代码中只给出了替换了一部分人物名称的条件语句,仅供参考。如果需要统计其他人物,可以根据实际需要修改代码中的条件语句。
使用jieba分词统计人物的步骤如下:
1. 导入jieba库并安装。
2. 定义一个分词函数,该函数接收文本作为输入,并返回分词结果。
3. 定义一个字典counts,用于存储每个人物的出现次数。
4. 遍历分词结果,如果遇到指定的人物词语,则将其替换为对应的人物名称,并在counts中进行计数。
5. 对counts按照出现次数进行排序。
6. 输出出现次数最多的前10个人物及其出现次数。
请注意,以上步骤是基于给定示例代码的大致思路,具体实现可能会有一些细微差别。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
阅读全文