python使用jieba对字符串进行分词并获取字符串中的人名地名等信息
时间: 2023-12-26 12:03:57 浏览: 87
使用jieba对字符串进行分词并获取字符串中的人名、地名等信息,可以使用jieba的词性标注功能,对分词后的每个词语进行词性标注,然后根据标注结果提取需要的信息。具体步骤如下:
1. 导入jieba和posseg两个库:
```python
import jieba
import jieba.posseg as pseg
```
2. 对字符串进行分词和词性标注:
```python
text = "小明来自中国北京市海淀区。"
words = pseg.cut(text)
```
3. 遍历分词结果,提取人名和地名:
```python
person_list = [] # 存储人名
location_list = [] # 存储地名
for word, flag in words:
if flag == "nr":
person_list.append(word)
elif flag == "ns":
location_list.append(word)
```
完整代码如下:
```python
import jieba
import jieba.posseg as pseg
text = "小明来自中国北京市海淀区。"
words = pseg.cut(text)
person_list = [] # 存储人名
location_list = [] # 存储地名
for word, flag in words:
if flag == "nr":
person_list.append(word)
elif flag == "ns":
location_list.append(word)
print("人名:", person_list)
print("地名:", location_list)
```
输出结果如下:
```
人名: ['小明']
地名: ['中国', '北京市', '海淀区']
```
通过以上代码,就可以方便地对字符串进行分词并提取其中的人名、地名等信息了。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)