dataframe distinct
时间: 2023-09-05 08:09:43 浏览: 117
要获取 DataFrame 中的唯一值(distinct values),可以使用 `drop_duplicates()` 方法或者 `unique()` 方法。
使用 `drop_duplicates()` 方法:
```python
import pandas as pd
# 创建示例 DataFrame
data = {'col1': ['A', 'B', 'A', 'C', 'B'],
'col2': [1, 2, 1, 3, 2]}
df = pd.DataFrame(data)
# 获取唯一值
unique_values = df.drop_duplicates()
print(unique_values)
```
输出结果:
```
col1 col2
0 A 1
1 B 2
C 3
```
使用 `unique()` 方法:
```python
import pandas as pd
# 创建示例 DataFrame
data = {'col1': ['A', 'B', 'A', 'C', 'B'],
'col2': [1, 2, 1, 3, 2]}
df = pd.DataFrame(data)
# 获取唯一值
unique_values = df['col1'].unique()
print(unique_values)
```
输出结果:
```
['A' 'B' 'C']
```
在第一个示例中,`drop_duplicates()` 方法被应用在整个 DataFrame 上,返回了一个包含唯一值的新 DataFrame。
在第二个示例中,`unique()` 方法被应用在 DataFrame 的特定列 `'col1'` 上,返回了该列中的唯一值数组。
阅读全文
相关推荐

















