一个csv文档的某一列数据是一段文本,如何去判断这个文本句子里是否含某些词,如何有关键词,则取值1,否则取值0
时间: 2024-05-14 20:12:40 浏览: 72
可以使用Python中的pandas和numpy库来实现。
首先,读取csv文件并将文本列转换为一个列表:
```python
import pandas as pd
df = pd.read_csv('file.csv')
text_list = df['text_column'].tolist()
```
然后,定义一个包含关键词的列表:
```python
keywords = ['keyword1', 'keyword2', 'keyword3']
```
接下来,定义一个函数来判断文本句子是否包含关键词:
```python
def contains_keyword(text, keywords):
for keyword in keywords:
if keyword in text:
return 1
return 0
```
最后,使用numpy库将包含关键词的文本列转换为一个包含0和1的新列:
```python
import numpy as np
contains_keyword_arr = np.array([contains_keyword(text, keywords) for text in text_list])
df['contains_keyword_column'] = contains_keyword_arr
```
现在,包含关键词的文本列就被转换为了一个包含0和1的新列,可以将其保存为新的csv文件:
```python
df.to_csv('new_file.csv', index=False)
```
阅读全文