python按关键词列表对dataframe中中文文本数据提取关键词作为新的列
时间: 2023-11-13 14:02:02 浏览: 133
基于Python实现中文文本关键词抽取【100011007】
您可以使用Python中的jieba库来进行中文文本的关键词提取,并将提取的关键词作为新的列添加到DataFrame中。以下是一个示例代码:
```
import jieba
# 定义关键词列表
keywords_list = ['关键词1', '关键词2', '关键词3']
# 读取数据到DataFrame
df = pd.read_csv('data.csv')
# 对每行文本数据进行关键词提取
df['keywords'] = df['text'].apply(lambda x: [word for word in jieba.cut(x) if word in keywords_list])
# 打印结果
print(df.head())
```
在上面的代码中,我们首先导入了jieba库,然后定义了一个包含关键词的列表。接下来,我们使用pandas库的read_csv函数将数据读取到DataFrame中。然后,我们使用apply函数对每行文本数据进行处理,从中提取出包含在关键词列表中的关键词,并将它们作为一个新的列添加到DataFrame中。最后,我们打印出结果以检查是否正确地添加了新的列。
阅读全文