2)使用Jieba库对《三国演义》进行分词处理,分别统计周瑜、吕布、夏侯惇的出场次数。
时间: 2024-03-07 08:46:30 浏览: 63
好的,我可以回答你的问题。首先,我们需要安装jieba库,可以通过以下命令来安装:
```
pip install jieba
```
安装完成后,我们可以使用以下代码进行分词处理和统计:
```python
import jieba
# 读取《三国演义》的文本
with open('sgyy.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 对文本进行分词处理
words = jieba.lcut(content)
# 统计周瑜、吕布、夏侯惇的出现次数
zhou_count = 0
lv_count = 0
xia_count = 0
for word in words:
if word == '周瑜':
zhou_count += 1
elif word == '吕布':
lv_count += 1
elif word == '夏侯惇':
xia_count += 1
print('周瑜出现次数:', zhou_count)
print('吕布出现次数:', lv_count)
print('夏侯惇出现次数:', xia_count)
```
其中,我们需要将《三国演义》的文本保存在当前目录下的一个名为sgyy.txt的文件中。
运行以上代码,即可得到周瑜、吕布、夏侯惇的出现次数。
相关问题
使用jieba第三方包对《三国演义》文本进行分词,统计诸葛亮出场的次数
好的,下面是Python代码实现:
```python
import jieba
# 读取《三国演义》文本
with open('sgyy.txt', 'r', encoding='utf-8') as f:
sgyy = f.read()
# 对文本进行分词,并统计诸葛亮出现次数
count = 0
words = jieba.cut(sgyy)
for word in words:
if word == '诸葛亮':
count += 1
print('诸葛亮出现的次数为:', count)
```
其中,需要先将《三国演义》文本保存为sgyy.txt文件,并放在代码所在的目录下。执行该代码会输出诸葛亮在文本中出现的次数。
使用jieba库对药品名称进行分词的代码
以下是使用jieba库对药品名称进行分词的代码示例:
```python
import jieba
# 待分词的药品名称
drug_name = '阿莫西林克拉维酸钾片'
# 分词
seg_list = jieba.cut(drug_name)
# 输出分词结果
print(' '.join(seg_list))
```
输出结果为:
```
阿莫西林 克拉维酸钾 片
```
可以看到,使用jieba库对药品名称进行分词后,得到了分词结果,并且将分词结果用空格连接起来。
阅读全文