怎么用unique函数去重DataFrame某列
时间: 2024-02-23 12:03:31 浏览: 80
pandas对dataFrame中某一个列的数据进行处理的方法
可以使用 pandas 库中的 `unique()` 函数来去重一个 DataFrame 中的某一列,具体步骤如下:
1. 导入 pandas 库:
``` python
import pandas as pd
```
2. 创建 DataFrame:
``` python
df = pd.DataFrame({'A': [1, 2, 3, 4, 4, 5], 'B': ['a', 'b', 'c', 'd', 'd', 'e']})
```
DataFrame `df` 如下所示:
| | A | B |
|:-:|:-:|:-:|
| 0 | 1 | a |
| 1 | 2 | b |
| 2 | 3 | c |
| 3 | 4 | d |
| 4 | 4 | d |
| 5 | 5 | e |
3. 使用 `unique()` 函数去重:
``` python
unique_values = df['B'].unique()
```
`unique_values` 变量中的值为 `[a, b, c, d, e]`。
如果要在原 DataFrame 中去重,可以使用 `drop_duplicates()` 函数:
``` python
df.drop_duplicates(subset=['B'], inplace=True)
```
上述代码会在原 DataFrame 中去重,只保留 `B` 列中的唯一值,最终 DataFrame 如下所示:
| | A | B |
|:-:|:-:|:-:|
| 0 | 1 | a |
| 1 | 2 | b |
| 2 | 3 | c |
| 3 | 4 | d |
| 5 | 5 | e |
阅读全文