首页读取文本文件text. txt，进行中文分词，统计其中含有“水”字的词语的个数

读取文本文件text. txt，进行中文分词，统计其中含有“水”字的词语的个数

时间: 2024-03-16 18:45:49 浏览: 105

您好，针对您的问题，我可以给出以下解决方案： 1. 首先，需要安装中文分词工具，比如jieba库，在命令行输入以下命令进行安装： ``` pip install jieba ``` 2. 然后，读取文本文件text.txt，可以使用Python内置的open函数进行文件读取，代码如下： ```python with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() ``` 这里假设text.txt文件跟Python代码在同一目录下，使用utf-8编码。 3. 使用jieba进行中文分词，统计包含“水”字的词语个数，代码如下： ```python import jieba words = jieba.lcut(text) # 对文本进行分词 count = 0 for word in words: if '水' in word: count += 1 print(count) ``` 这里使用jieba.lcut函数对文本进行分词，得到一个词语列表，然后遍历词语列表，判断每个词语是否包含“水”字，如果是则计数器加1。最后输出计数器的值即可。希望这个解决方案能够帮助到您！

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通全年可省5,000元立即开通