没有合适的资源?快使用搜索试试~ 我知道了~
首页使用sklearn进行对数据标准化、归一化以及将数据还原的方法
资源详情
资源评论
资源推荐

使用使用sklearn进行对数据标准化、归一化以及将数据还原的方法进行对数据标准化、归一化以及将数据还原的方法
今天小编就为大家分享一篇使用sklearn进行对数据标准化、归一化以及将数据还原的方法,具有很好的参考价
值,希望对大家有所帮助。一起跟随小编过来看看吧
在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理。
这里通过使用sklearn.preprocess模块进行处理。
一、标准化和归一化的区别一、标准化和归一化的区别
归一化其实就是标准化的一种方式,只不过归一化是将数据映射到了[0,1]这个区间中。
标准化则是将数据按照比例缩放,使之放到一个特定区间中。标准化后的数据的均值=0,标准差=1,因而标准化的数据可
正可负。
二、使用二、使用sklearn进行标准化和标准化还原进行标准化和标准化还原
原理:
即先求出全部数据的均值和方差,再进行计算。
最后的结果均值为0,方差是1,从公式就可以看出。
但是当原始数据并不符合高斯分布的话,标准化后的数据效果并不好。
导入模块
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
from matplotlib import gridspec
import numpy as np
import matplotlib.pyplot as plt
通过生成随机点可以对比出标准化前后的数据分布形状并没有发生变化,只是尺度上缩小了。
cps = np.random.random_integers(0, 100, (100, 2))
ss = StandardScaler()
std_cps = ss.fit_transform(cps)
gs = gridspec.GridSpec(5,5)
fig = plt.figure()
ax1 = fig.add_subplot(gs[0:2, 1:4])
ax2 = fig.add_subplot(gs[3:5, 1:4])
ax1.scatter(cps[:, 0], cps[:, 1])
ax2.scatter(std_cps[:, 0], std_cps[:, 1])
plt.show()

















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0