首页pandas中一列DataFrame包含多余的文本，想通过一列关键词进行比对，如果关键词在该文本中则返回关键词

pandas中一列DataFrame包含多余的文本，想通过一列关键词进行比对，如果关键词在该文本中则返回关键词

时间: 2023-03-30 07:03:17 浏览: 122

pandas对dataFrame中某一个列的数据进行处理的方法

背景：dataFrame的数据，想对某一个列做逻辑处理，生成新的列，或覆盖原有列的值下面例子中的df均为pandas.DataFrame()的数据 1、增加新列，或更改某列的值 df["列名"]=值如果值为固定的一个值，则dataFrame中该列所有值均为这个数据 2、处理某列 df["列名"]=df.apply(lambda x:方法名(x,入参2),axis=1) 说明： 1、方法名为单独的方法名，可以处理传入的x数据 2、x为每一行的数据，做为方法的入参1；x中的数据可以用【x.列名】来获取 3、入参2等为方法需要的其他参数，不需要可以不写 4、axis=1，表示每次取一行数据进

可以使用str.contains()方法来实现，例如： df['关键词匹配列'] = df['文本列'].str.contains('关键词') 其中，df为你的DataFrame，'文本列'为包含多余文本的列，'关键词'为你要匹配的关键词。这样，如果该文本中包含关键词，'关键词匹配列'对应的值就会为True，否则为False。

阅读全文