首页MinMaxScaler()参数每一列

MinMaxScaler()参数每一列

时间: 2023-02-12 16:19:55 浏览: 166

实现了对一个数据集csv文件的数据预处理、异常值检测、数据重构以及使用多种机器学习模型

数据读取与基本信息统计从DM_Project_24.csv文件读取数据，计算数据集中缺失值的总数、标签列缺失值数量、每个特征的缺失值数量，并统计了标签中 0 和 1 的数量。将数据集按特征类型进行了划分，包括所有特征、数值特征、名义特征和标签列。数据预处理使用SimpleImputer对数值特征和名义特征的缺失值分别进行中位数填充和众数填充。对填充后的数值特征进行了归一化处理（MinMaxScaler）和标准化处理（StandardScaler）。异常值检测使用DBSCAN算法分别对归一化和标准化后的数值特征进行异常值检测，根据给定的eps和min_samples参数确定异常值，并返回去除异常值后的数据集。使用IsolationForest算法对归一化和标准化后的数值特征进行异常值检测，根据设定的n_estimators和contamination参数确定异常值，得到去除异常值后的数据集。使用LocalOutlierFactor算法对归一化和标准化后的数值特征进行异常值检测，通过计算每个数据点的局部离群因子来确定异常值，返回删除异常值后的数据集。数据重构

MinMaxScaler() 的参数有以下几个: 1. feature_range: 设定数据缩放后的最大值和最小值，默认为(0,1)。 2. copy: 是否对数据进行复制，默认为True。 MinMaxScaler() 对每一列都进行数据缩放，使得缩放后的每一列的数据都在指定的feature_range范围内。

阅读全文