数据查看是特征工程的第一步,列举出 5 个常用的数据查看方法,并分别说明其作用
时间: 2024-02-29 11:54:55 浏览: 14
1. head()方法:用于查看数据集的前几行,默认是前5行。通过该方法可以快速了解数据集的基本情况,包括数据类型、缺失值、异常值等。
2. tail()方法:用于查看数据集的最后几行,默认也是后5行。该方法和head()方法作用相似,可以帮助我们快速了解数据集的基本情况。
3. info()方法:用于查看数据集的基本信息,包括每列的名称、数据类型、非空值数量、占用内存等。通过该方法可以查看数据集的基本结构和缺失值情况。
4. describe()方法:用于查看数据集的基本统计信息,包括均值、标准差、最小值、最大值、四分位数等。通过该方法可以了解数据集的分布情况和异常值情况。
5. value_counts()方法:用于查看某一列的取值情况及其出现次数。该方法可以帮助我们了解某一列的分布情况,特别适用于分类型变量。
相关问题
数据查看是特征工程的第一步,列举出 10 个常用的数据查看方法,并分别说明其作用
1. head()方法:用于查看数据集的前几行,默认是前5行。通过该方法可以快速了解数据集的基本情况,包括数据类型、缺失值、异常值等。
2. tail()方法:用于查看数据集的最后几行,默认也是后5行。该方法和head()方法作用相似,可以帮助我们快速了解数据集的基本情况。
3. info()方法:用于查看数据集的基本信息,包括每列的名称、数据类型、非空值数量、占用内存等。通过该方法可以查看数据集的基本结构和缺失值情况。
4. describe()方法:用于查看数据集的基本统计信息,包括均值、标准差、最小值、最大值、四分位数等。通过该方法可以了解数据集的分布情况和异常值情况。
5. value_counts()方法:用于查看某一列的取值情况及其出现次数。该方法可以帮助我们了解某一列的分布情况,特别适用于分类型变量。
6. isnull()方法:用于查看数据集中的缺失值情况,可以返回每个元素是否为缺失值。
7. corr()方法:用于查看数据集中各列之间的相关系数。通过该方法可以了解各列之间的线性关系,特别适用于特征选择和降维。
8. groupby()方法:用于对数据集进行分组,可以对分组后的数据进行聚合操作。通过该方法可以了解各组之间的数据分布情况。
9. pivot_table()方法:用于对数据集进行透视表操作,可以将数据按照不同的维度进行汇总。通过该方法可以了解各维度之间的数据关系。
10. sample()方法:用于从数据集中随机抽取样本。通过该方法可以了解数据集的随机性和稳定性,可以帮助我们评估模型的泛化能力。
列举出activity5个回调函数,并分别说明其作用
1. onCreate(): 这个回调函数是在Activity创建时调用的,主要用于初始化Activity的布局和组件等。在这个回调函数中,我们可以设置布局文件、初始化控件、绑定事件等。
2. onStart(): 这个回调函数是在Activity启动时调用的,主要用于准备Activity的显示。在这个回调函数中,我们可以进行一些必要的准备工作,如启动线程、注册广播接收器等。
3. onResume(): 这个回调函数是在Activity恢复时调用的,主要用于开始活动。在这个回调函数中,我们可以恢复Activity状态、开始动画、启动传感器等。
4. onPause(): 这个回调函数是在Activity暂停时调用的,主要用于暂停活动。在这个回调函数中,我们可以保存Activity状态、停止动画、停止传感器等。
5. onStop(): 这个回调函数是在Activity停止时调用的,主要用于释放资源。在这个回调函数中,我们可以释放资源、取消注册广播接收器等。