练习数据规范化: 数据 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70 - 使用最小-最大规范化将 35 映射到 [0,1] 区间 - 使用z分数规范化变化 35 - 使用小数定标规范化变换 35 - 使用深度为 3 的箱,用箱均值光滑数据。
时间: 2023-05-28 14:01:19 浏览: 68
- 最小-最大规范化:将最小值设为0,最大值设为1,其他值按比例映射。
首先计算出最小值和最大值:
min_value = 13
max_value = 70
然后将35映射到[0,1]区间:
normalized = (35 - min_value) / (max_value - min_value)
= (35 - 13) / (70 - 13)
= 0.438
所以35经过最小-最大规范化后,映射到[0,1]区间的值为0.438。
- z分数规范化: 将数据减去平均值,除以标准差,使得数据均值为0,标准差为1。
首先计算出平均值和标准差:
mean = (13+15+16+16+19+20+20+21+22+22+25+25+25+25+30+33+33+35+35+35+35+36+40+45+46+52+70) / 27
= 30.185
std_dev = sqrt([(13-30.185)^2 + (15-30.185)^2 + ... + (70-30.185)^2] / 26)
= 14.584
然后将35进行z分数规范化:
normalized = (35 - mean) / std_dev
= (35 - 30.185) / 14.584
= 0.329
所以35经过z分数规范化后,值为0.329。
- 小数定标规范化: 将数据除以一个基准值,通常是10的幂次方,使得数据的绝对值小于1。
将所有数据除以一个基准值10的幂次方,使得35的绝对值小于1:
base = 10^2
normalized = 35 / base
= 0.35
所以35经过小数定标规范化后,值为0.35。
- 箱均值光滑化: 将数据根据深度为3的箱进行分组,每个组用该组的均值进行代替,从而光滑数据。
将数据分为8个组(箱):
箱1:13, 15
箱2:16, 16, 19, 20, 20, 21
箱3:22, 22, 25, 25, 25, 25, 30
箱4:33, 33
箱5:35, 35, 35, 35
箱6:36
箱7:40, 45, 46, 52
箱8:70
取每个箱的均值:
箱1:(13+15)/2 = 14
箱2:(16+16+19+20+20+21)/6 = 18.67
箱3:(22+22+25+25+25+25+30)/7 = 24.57
箱4:(33+33)/2 = 33
箱5:(35+35+35+35)/4 = 35
箱6:36
箱7:(40+45+46+52)/4 = 45.75
箱8:70
然后将每个数据点映射到所在的箱的均值:
映射后:14, 14, 18.67, 18.67, 18.67, 18.67, 18.67, 18.67, 24.57, 24.57, 24.57, 24.57, 24.57, 24.57, 33, 33, 35, 35, 35, 35, 36, 45.75, 45.75, 45.75, 45.75, 70
所以35经过深度为3的箱均值光滑化后,映射到所在组的均值为18.67。