使用 jieba 分词和词性标注并提取名词列表
时间: 2024-10-24 07:02:24 浏览: 60
jieba分词详解和实践
在Python中,jieba库提供了一个方便的方式来分词并标注每个词的词性。以下是如何使用jieba进行中文分词和名词(n或nr)提取的一个简单示例:
首先,你需要安装jieba库,如果还没安装,可以使用pip安装:
```bash
pip install jieba
```
然后导入必要的包:
```python
import jieba.posseg as pseg
```
接着定义一个函数来提取名词:
```python
def extract_nouns(text):
# 使用pseg.cut()方法进行分词并标注词性
words = pseg.cut(text)
# 过滤出名词,包括普通名词(n)和人名(nr)
nouns = [word for word, flag in words if flag in ('n', 'nr')]
# 返回名词列表
return list(nouns)
# 测试例子
text = "我喜欢阅读科幻小说和历史书籍。"
nouns_list = extract_nouns(text)
print("名词列表:", nouns_list)
```
当你运行这个函数,它会返回文本中所有名词组成的列表。
阅读全文