pandas contains 的用法
时间: 2023-03-20 17:08:20 浏览: 98
pandas中的contains()函数用于检查Series或DataFrame中的字符串是否包含指定的子字符串。它返回一个布尔值的Series或DataFrame,指示每个元素是否包含子字符串。contains()函数还可以接受正则表达式作为参数,以便更灵活地匹配字符串。
相关问题
pandas SERIES CONTAINS
Pandas Series是一种一维的数据结构,类似于数组或列表。它由两个主要的部分组成:索引和值。索引是用于标识和访问Series中的数据的标签,而值则是实际存储的数据。
Series可以包含各种不同类型的数据,包括整数、浮点数、字符串等。它提供了许多功能强大的方法和操作,使得数据的处理和分析变得更加方便。
以下是一些Series常用的操作和功能:
1. 创建Series:可以通过传入列表、字典、数组等来创建Series。
2. 索引和切片:可以使用索引标签或位置来访问Series中的数据,也可以使用切片来获取部分数据。
3. 基本操作:可以对Series进行基本的数学运算,如加法、减法、乘法和除法。
4. 过滤和排序:可以根据条件过滤Series中的数据,也可以按照索引或值进行排序。
5. 缺失值处理:可以处理Series中的缺失值,如删除或填充缺失值。
6. 统计分析:可以计算Series中的最大值、最小值、平均值、总和等统计指标。
7. 数据可视化:可以使用内置的绘图功能将Series数据可视化。
pandas str.contains
pandas str.contains() 方法是用来检查一个字符串是否包含另一个字符串的方法。它可以被用于 Series 和 DataFrame 对象中的字符串列。该方法返回一个布尔类型的 Series,其中每个元素表示对应的字符串是否包含指定的子字符串。
下面是一个示例,说明如何使用 pandas str.contains() 方法:
```python
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'city': ['New York', 'Los Angeles', 'Chicago', 'Houston']})
# 检查 'name' 列是否包含 'li'
result = df['name'].str.contains('li')
print(result)
```
输出结果:
```
0 True
1 False
2 True
3 False
Name: name, dtype: bool
```
在上面的示例中,我们创建了一个 DataFrame,其中包含了一些人的姓名、年龄和所在城市。我们使用 str.contains() 方法检查了 'name' 列中的每个字符串是否包含 'li' 子字符串,并将结果存储在布尔类型的 Series 中。最后,我们将结果打印出来。