用pandas的方法判断csv第5列的数据是否含有某些特定词,当满足含有其中一个词时,第五列的数据是一些文本句子含有则取值1,不含有则取值0
时间: 2024-05-12 20:17:27 浏览: 68
使用pandas读取csv文件的指定列方法
假设csv文件名为data.csv,可以使用以下代码:
```
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 定义特定词列表
specific_words = ['word1', 'word2', 'word3']
# 判断第5列数据是否含有特定词
df['col5_flag'] = df['col5'].apply(lambda x: 1 if any(word in x for word in specific_words) else 0)
# 输出结果
print(df)
```
其中,`specific_words`是特定词列表,可以根据需要修改。`df['col5_flag']`是新建一列,用于存储第5列数据是否含有特定词的结果,根据实际情况可以修改列名。`lambda x: 1 if any(word in x for word in specific_words) else 0`是一个lambda表达式,用于判断第5列每行数据是否含有特定词,并返回0或1。最后,将新建的一列输出即可。
阅读全文