首页如何获得dataframe的特征

如何获得dataframe的特征

时间: 2023-12-03 19:24:42 浏览: 90

Task3 特征工程

Task3 特征工程一、数据预处理在这一块，比较常用的包是sklearn.Processing data,主要包括以下操作：异常值处理使用箱型图（或小提琴图）发现离群点（off-group points）之后，为了不干扰实验结果，我们通常将离群点处理掉： #from DW阿泽 import the code def outliers_proc(data, col_name, scale=3): 用于清洗异常值，默认用 box_plot（scale=3）进行清洗 :param data: 接收 pandas 数据格式 :param col_name: pan

1. 使用info()方法查看DataFrame中每列的数据类型、非空值数量和内存使用情况。 2. 使用describe()方法查看DataFrame中数值列的统计信息，如均值、标准差、最小值、最大值等。 3. 使用shape属性查看DataFrame的行数和列数。 4. 使用columns属性查看DataFrame的列名。 5. 使用head()或tail()方法查看DataFrame的前几行或后几行数据。 6. 使用isnull()方法查看DataFrame中的缺失值情况。 7. 使用duplicated()方法查看DataFrame中是否有重复行。 8. 对于分类变量，可以使用value_counts()方法查看每个类别出现的次数。 9. 对于时间序列数据，可以使用index属性查看时间索引的数据类型和范围。 10. 对于文本数据，可以使用str属性查看每个字符串的长度、是否含有特定字符等信息。

阅读全文