dataframe drop的用法
时间: 2024-09-25 11:18:45 浏览: 28
pandas.DataFrame.drop_duplicates 用法介绍
`pandas.DataFrame.drop` 是 Pandas 库中的一个非常常用的方法,用于从 DataFrame 中删除指定的行或列。这个方法可以接受多个参数,根据传入的不同参数有不同的用途:
1. **axis** (默认为 0, 表示行):
- 0 或 'index':表示按照行(索引)删除。
- 1:表示按列删除。
2. **labels**:
- 列名(如果 axis=1)或行标签(如果 axis=0)列表、数组或 Series,用于删除这些特定的行或列。
3. **index** 和/or **columns**:
- 如果不提供 labels 参数,可以直接使用 index 和 columns 关键字参数来删除对应的行或列。例如,`df.drop(index=[row_index_1, row_index_2], columns=['column_name'])`。
4. **subset**: 只保留 subset 列的部分数据,其他列会被删除。
5. ** inplace** (默认 False):
- 如果设为 True,则直接在原始 DataFrame 上进行修改,否则返回一个新的 DataFrame。
6. **errors**: 错误处理策略,可以设置为 'raise'(抛出异常)、'ignore'(忽略错误)或 'coerce'(尝试转换缺失值)。
一个简单的例子可能是这样的:
```python
import pandas as pd
# 假设 df 是一个 DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# 删除第一行
dropped_df = df.drop(df.index[0])
# 删除 'B' 列
dropped_df = df.drop('B')
# 仅保留 'A' 和 'C' 列
dropped_df = df.drop(['B'], axis=1)
# 在原地删除指定行和列
df.drop(['B', df.index[1]], axis=1, inplace=True)
```
阅读全文