使用sklearn进行对数据标准化、归一化以及将数据还原的方法 - CSDN文库

数据标准化

5星 · 超过95%的资源 2 浏览量更新于2023-03-03 1 收藏 82KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

使用使用sklearn进行对数据标准化、归一化以及将数据还原的方法进行对数据标准化、归一化以及将数据还原的方法

今天小编就为大家分享一篇使用sklearn进行对数据标准化、归一化以及将数据还原的方法，具有很好的参考价

值，希望对大家有所帮助。一起跟随小编过来看看吧

在对模型训练时，为了让模型尽快收敛，一件常做的事情就是对数据进行预处理。

这里通过使用sklearn.preprocess模块进行处理。

一、标准化和归一化的区别一、标准化和归一化的区别

归一化其实就是标准化的一种方式，只不过归一化是将数据映射到了[0,1]这个区间中。

标准化则是将数据按照比例缩放，使之放到一个特定区间中。标准化后的数据的均值＝0，标准差＝1，因而标准化的数据可

正可负。

二、使用二、使用sklearn进行标准化和标准化还原进行标准化和标准化还原

原理：

即先求出全部数据的均值和方差，再进行计算。

最后的结果均值为0，方差是1，从公式就可以看出。

但是当原始数据并不符合高斯分布的话，标准化后的数据效果并不好。

导入模块

from sklearn.preprocessing import StandardScaler

from sklearn.preprocessing import MinMaxScaler

from matplotlib import gridspec

import numpy as np

import matplotlib.pyplot as plt

通过生成随机点可以对比出标准化前后的数据分布形状并没有发生变化，只是尺度上缩小了。

cps = np.random.random_integers(0, 100, (100, 2))

ss = StandardScaler()

std_cps = ss.fit_transform(cps)

gs = gridspec.GridSpec(5,5)

fig = plt.figure()

ax1 = fig.add_subplot(gs[0:2, 1:4])

ax2 = fig.add_subplot(gs[3:5, 1:4])

ax1.scatter(cps[:, 0], cps[:, 1])

ax2.scatter(std_cps[:, 0], std_cps[:, 1])

plt.show()

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

weixin_38519763

粉丝: 5
资源: 922

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈