pandas contains
时间: 2023-11-05 08:56:20 浏览: 138
pandas中的contains()函数用于检查Series中每个元素是否包含指定的字符串,并返回一个布尔值的Series,指示是否包含。可以通过传递参数regex=False来禁用正则表达式匹配。例如,在给定的Series中查找包含字母'o'的元素,可以使用下面的代码:
s.str.contains('o', regex=False)
该函数还可以在数据查询中使用。比如,在给定的DataFrame中查找名字中包含字母'A'的行,可以使用下面的代码:
df.loc[df.name.str.contains('A')]
如果需要同时查找包含字母'A'或'E'的行,可以使用正则表达式的或操作符'|':
df.loc[df.name.str.contains('A|E')]
如果需要忽略大小写,可以使用flags=re.IGNORECASE参数:
df.loc[df.name.str.contains('A|E', flags=re.IGNORECASE)]
另外,还可以使用startswith()和endswith()函数来指定字符串是以指定的字符开头还是结尾。例如,查找以'O'开头的元素:
s.str.startswith('O')
如果想要忽略空值的处理,可以传递参数na=False。例如:
s.str.startswith('O', na=False)
使用match()函数可以确定每个字符串是否与正则表达式匹配。例如,检查每个字符串是否由一个数字和一个小写字母组成:
pd.Series(['1', '2', '3a', '3b', '03c']).str.match(r'[0-9][a-z]')
阅读全文