import jieba excludes={"将军","却说","这样","他们","东汉","","然而","自己","这个","没有"} txt=open("C:\python\三国演义.txt","r",encoding='utf-8').read() words=jieba.lcut(txt) counts={} for word in words: if len(word)==1: continue else: counts[word]=counts.get(word,0)+1 items=list(counts.items()) items.sort(key=lambda x:x[1],reverse=True) for i in range(15): word,count=items[i] print("{0:<10}{1:>5}".format(word,count))

时间: 2023-06-17 10:02:04 浏览: 53

这段代码使用了jieba库对三国演义进行分词，并且统计每个词出现的次数，最后输出出现频率最高的15个词及其出现次数。在代码中，使用了一个字典counts来存储每个词的出现次数，使用了items()方法将字典转化为列表，使用了sort()方法对列表进行排序，最后使用了format()方法进行输出。其中，excludes参数是在分词时指定需要排除的一些词语。注意，这段代码中读取文件的路径需要使用双斜杆或者单斜杆加r来表示，否则会出错。

import jieba excludes = {"将军","却说","荆州","二人","不可","不能","如此"}

Unfortunately, as an AI language model, I am not able to execute such a command. However, I can explain that the command "import jieba" imports the jieba library, which is a Chinese text segmentation library used to split Chinese sentences into individual words. The "excludes" parameter is used to exclude certain words from being segmented, in this case, the words "将军", "却说", "荆州", "二人", "不可", "不能", and "如此".

import jieba excludes={"将军","却说","这样","他们","东汉","","然而","自己","这个","没有"} txt=open("C:\python\三国演义.txt","r",encoding='utf-8').read() words=jieba.lcut(txt) counts={} for word in words: if len(word)==1: continue else: counts[word]=counts.get(word,0)+1 items=list(counts.items()) items.sort(key=lambda x:x[1],reverse=True) for i in range(15): word,count=items[i] print("{0:<10}{1:>5}".format(word,count))请问这段代码有错吗

这段代码缺少语法错误，但可能会有以下问题： 1. `excludes`参数应该是`jieba.lcut()`的参数之一，应该写成`jieba.lcut(txt, exclude=excludes)`。 2. 打开文件路径中的反斜杠`\`应该写成双反斜杠`\\`或者使用原始字符串`r`，即`txt=open(r"C:\python\三国演义.txt","r",encoding='utf-8').read()`。 3. `counts`字典中的键值对没有按照词频排序，应该在输出之前将它们按照词频排序，可以使用`sorted()`函数，即`items = sorted(counts.items(), key=lambda x:x[1], reverse=True)`。 4. 如果要剔除一些常用的词语，需要将它们放在`excludes`列表中，而不是将它们写成一个字符串。修改后的代码如下： ```python import jieba excludes = ["将军", "却说", "这样", "他们", "东汉", "", "然而", "自己", "这个", "没有"] txt = open(r"C:\python\三国演义.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt, exclude=excludes) counts = {} for word in words: if len(word) == 1: continue else: counts[word] = counts.get(word, 0) + 1 items = sorted(counts.items(), key=lambda x:x[1], reverse=True) for i in range(15): word, count = items[i] print("{0:<10}{1:>5}".format(word, count)) ```

import jieba excludes = {"将军","却说","荆州","二人","不可","不能","如此"}

相关推荐

python jieba分词并统计词频后输出结果到Excel和txt文档方法

结巴 jieba 分词，solr7.5使用的jieba分词，自己gradle编译的

jieba库，为没有装对位置的朋友们提供

import jieba content ='我是小明的好朋友' words=jieba.lcut(content) print(f'分词 pip结果--->{words}')

import jieba txt = input('请输入一段中文文本：') ls=jieba.lcut(txt) print('{:1f}').format(len(txt)/len(ls))，如何理解这段代码

import jieba word = input() dicts = open("dict.txt","r",encoding='utf-8') for line in dicts.readlines(): a=jieba.lcut(line) if word in a: print(line) break else: print("这个词我不明白") dicts.close()

import jieba f1= open("sy9//宋词.txt", "r") #代码开始 #代码结束 for i in range(15): print("{}{}".format(items[i][0],items[i][1]))

import jieba import jieba.analyse

import jieba

import jieba import jieba.posseg as psg S="市长江大桥视察了长江大桥" lst1=jieba.lcut(s) print(lst1) jieba.add_wo

jieba.lcut(txt,cut_all=True)

from random import randint for i in range(10): s=" ".join(str(randint(1,100))) fo=open("rm.txt","w") fo.write(s) fi=open("rm.txt","r") import jieba s1=jieba.lcuts(fi.read()) s2=s1.replace(" ",",") fc=open("rm.csv","w") fc.write(s2) fi.close() fc.close()

最新推荐

计算机基础知识试题与解答

管理建模和仿真的文件

【进阶】音频处理基础：使用Librosa

设置ansible 开机自启

计算机基础知识试题与解析

"互动学习：行动中的多样性与论文攻读经历"

【基础】网络编程入门：使用HTTP协议

时间序列大模型的研究进展

计算机基础知识试题与解析

关系数据表示学习