dataframe 行筛选 数量比较
时间: 2023-05-17 17:00:53 浏览: 120
pandas系列之DataFrame 行列数据筛选实例
5星 · 资源好评率100%
DataFrame 行筛选是指通过条件筛选出符合条件的行数据,常见的方法有使用布尔索引和使用 query() 函数。此外,比较行数据数量可以通过不同的方法来实现。
对于行筛选,布尔索引是一种有效的方法,可以通过运算符(例如 ==、!=、>、<、>=、<=)和与、或、非逻辑运算符来创建条件。例如,可以使用以下代码筛选出 DataFrame 中 x 列大于等于 5 且 y 列等于 12 的行数据:
```python
df[(df['x'] >= 5) & (df['y'] == 12)]
```
query() 函数则更为简洁,可以直接传递一个字符串作为条件,例如:
```python
df.query('x >= 5 and y == 12')
```
两种方法都可以实现行筛选,具体使用哪种方法取决于个人习惯和任务需求。
在比较行数据数量时,可以使用 count() 函数统计 DataFrame 中每一列非缺失值的数量。例如,可以使用以下代码统计 DataFrame 中各列非缺失值的数量:
```python
df.count()
```
此外,还可以通过 shape 属性获取 DataFrame 的形状信息,其中第一维代表行数量,第二维代表列数量。例如,可以使用以下代码获取 DataFrame 的行数量:
```python
df.shape[0]
```
通过以上方法,可以方便地比较 DataFrame 中不同行数据的数量。
阅读全文