pandas unique 怎么用
时间: 2024-09-28 20:12:12 浏览: 23
在Pandas库中,`unique()`是一个非常有用的函数,用于获取Series或DataFrame中某个列或一列集合的唯一(不重复)值。它的基本语法如下:
```python
series.unique() 或 dataframe[['column_name']].unique()
```
对于Series:
```python
values = df['column_name'].unique() # 获取名为'column_name'列的所有独特值
```
对于DataFrame,它只返回单列的独特值:
```python
values = df[['column_name']].nunique() # nunique()会计算每个列的不同值的数量
unique_values = df[['column_name']].unique() # 同样获取所有独特值,但返回的是DataFrame,每一行代表一个独特值
```
`unique()`默认不会区分大小写,如果你想获得区分大小写的独特值,可以在调用时加上`return_index=False`和`keep='first'`:
```python
unique_values = df['column_name'].unique(keep='first', return_index=False)
```
`return_index=True`则会返回一个额外的索引数组,表示每个独特值第一次出现的位置。
相关问题
pandas unique()
pandas 的 unique() 函数可以用来返回一个 Series 或者 DataFrame 中的唯一值,可以用于去重和类别统计等操作。
用法示例:
```python
import pandas as pd
# 创建一个 Series
s = pd.Series([1, 2, 3, 2, 4, 5, 3, 6])
# 返回唯一值
unique_values = s.unique()
print(unique_values)
```
输出结果为:
```
[1 2 3 4 5 6]
```
如果是 DataFrame,可以在指定列上进行唯一值的统计:
```python
import pandas as pd
# 创建一个 DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 2, 4, 5, 3, 6], 'B': ['a', 'b', 'c', 'b', 'd', 'e', 'c', 'f']})
# 返回指定列唯一值
unique_values = df['B'].unique()
print(unique_values)
```
输出结果为:
```
['a' 'b' 'c' 'd' 'e' 'f']
```
pandas nunique
pandas中的nunique()函数用于计算数据框中唯一值的数量。它返回每列的唯一值数量。下面是一个示例:
```python
import pandas as pd
data = {'col1': [1, 2, 3, 4, 5],
'col2': ['a', 'b', 'c', 'd', 'e'],
'col3': [1, 1, 2, 2, 3]}
df = pd.DataFrame(data)
# 计算每列的唯一值数量
unique_counts = df.nunique()
print(unique_counts)
```
输出结果为:
```
col1 5
col2 5
col3 3
dtype: int64
```
这里的输出结果表示在列`col1`中有5个唯一值,在列`col2`中有5个唯一值,在列`col3`中有3个唯一值。
阅读全文