怎么看dataframe每列的特征种类数
时间: 2023-05-25 19:07:17 浏览: 41
可以使用 pandas 的 nunique 函数来统计每列的特征种类数。
示例代码:
```
import pandas as pd
# 创建一个示例 DataFrame
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'd'],
'C': ['x', 'y', 'z', 'z', 'y']
})
# 使用 nunique 函数统计每列的特征种类数
print(df.nunique())
```
输出结果:
```
A 5
B 4
C 3
dtype: int64
```
可以看到,DataFrame 的每列中分别有 5、4 和 3 种不同的特征值。
相关问题
dataframe查看某列值得种类
要查看DataFrame某列的所有唯一值的种类,可以使用pandas的unique()方法。
假设你的DataFrame名为df,要查看某列名为"column_name"的所有唯一值,可以使用以下代码:
df["column_name"].unique()
这将返回一个包含该列中所有唯一值的数组。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [大数据分析使用numpy在pandas dataframe上添加列](https://blog.csdn.net/yuuEva/article/details/109116832)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [如何根据列值从 DataFrame 中选择行?](https://blog.csdn.net/kalman2019/article/details/128428281)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
如何获得dataframe的特征
1. 使用info()方法查看DataFrame中每列的数据类型、非空值数量和内存使用情况。
2. 使用describe()方法查看DataFrame中数值列的统计信息,如均值、标准差、最小值、最大值等。
3. 使用shape属性查看DataFrame的行数和列数。
4. 使用columns属性查看DataFrame的列名。
5. 使用head()或tail()方法查看DataFrame的前几行或后几行数据。
6. 使用isnull()方法查看DataFrame中的缺失值情况。
7. 使用duplicated()方法查看DataFrame中是否有重复行。
8. 对于分类变量,可以使用value_counts()方法查看每个类别出现的次数。
9. 对于时间序列数据,可以使用index属性查看时间索引的数据类型和范围。
10. 对于文本数据,可以使用str属性查看每个字符串的长度、是否含有特定字符等信息。