df.nunique()
时间: 2024-05-06 12:18:11 浏览: 72
`df.nunique()` 是一个 pandas DataFrame 或 Series 的函数,用于返回每列(Series)中不同值的数量。例如,如果 `df` 是一个 DataFrame,`df.nunique()` 将返回一个 Series,其中每个索引是 DataFrame 的列名,每个值是该列中不同值的数量。如果 `df` 是一个 Series,则返回的是该 Series 中不同值的数量。
举个例子,假设我们有以下 DataFrame:
```
A B C
0 1 3 5
1 2 3 6
2 1 4 5
```
运行 `df.nunique()` 后,将返回以下 Series:
```
A 2
B 3
C 2
dtype: int64
```
其中,列 A 中有 2 个不同的值(1 和 2),列 B 中有 3 个不同的值(3、4 和 5),列 C 中有 2 个不同的值(5 和 6)。
相关问题
train_df = pd.read_csv('./data/train.csv', index_col = 0) test_df = pd.read_csv('./data/test.csv', index_col = 0) print("Number of rows: ", train_df.shape[0]) print("Number of columns: ", train_df.shape[1]) display(train_df) train_df.info() print("Number of rows: ", test_df.shape[0]) print("Number of columns: ", test_df.shape[1]) display(test_df) test_df.info() train_df.describe() # Check for NaN values and the number of unique values print("Are there any NaN values: ", train_df.isnull().values.any()) print(train_df.nunique()) # Count NaN values in each column nan_counts = train_df.isna().sum() # Print the counts print(nan_counts)
这段代码是用来读取两个csv文件,并对它们进行一些数据分析的。具体来说,它首先读取了一个名为train.csv的文件和一个名为test.csv的文件,并打印了它们的行数和列数。然后,它显示了train_df和test_df的内容和信息,包括每个列的数据类型和非空值的数量。接下来,它使用describe()函数对train_df进行描述统计,包括平均值、标准差、最小值、最大值等。最后,它检查train_df中是否有NaN值,并计算每列中的NaN值的数量,并打印出来。
tp = df.groupby('uid',as_index=False)[i].nunique() nunique是什么意思
`nunique` 是Pandas库中的一个函数,用于计算一个Series或DataFrame中的唯一值数量。在你的代码中,`df.groupby('uid',as_index=False)[i].nunique()`的作用是按照`uid`分组,然后对每个分组中的 `i` 列计算唯一值的数量。最终返回一个DataFrame,其中每个行代表一个分组,包括分组的`uid`和`i`列的唯一值数量。
阅读全文