分箱法 (1)假设有8、24、15、41、6、1 0、18、67、25等9个数,先对数进行从小到大的排序,再按等深分箱法分为3箱。 (2)分别用三种不同的平滑技术光滑噪声数据的值:按箱平均值求得平滑数据值:按箱中值求得平滑数据值:按箱边界值求得平滑数据值:
时间: 2023-12-28 17:13:53 浏览: 87
(1) 将数据从小到大排序:1, 6, 8, 10, 15, 18, 24, 25, 41, 67。将其分为3箱,每箱3个数。
- 箱1:1, 6, 8
- 箱2:10, 15, 18
- 箱3:24, 25, 41, 67
(2)
- 按箱平均值求得平滑数据值:
箱1平均值:(1+6+8)/3 = 5
箱2平均值:(10+15+18)/3 = 14.33
箱3平均值:(24+25+41+67)/4 = 39.25
平滑后的数据为:5, 5, 5, 14.33, 14.33, 14.33, 39.25, 39.25, 39.25。
- 按箱中值求得平滑数据值:
箱1中值:6
箱2中值:15
箱3中值:25
平滑后的数据为:6, 6, 6, 15, 15, 15, 25, 25, 25。
- 按箱边界值求得平滑数据值:
箱1边界值:1, 1, 8
箱2边界值:10, 10, 18
箱3边界值:24, 24, 67
平滑后的数据为:1, 1, 8, 10, 10, 18, 24, 24, 67。
相关问题
假设有8、24、15、41、6、1 0、18、67、25等9个数,先对数进行从小到大的排序,再按等深分箱法分为3箱。 (2)分别用三种不同的平滑技术光滑噪声数据的值:按箱平均值求得平滑数据值:按箱中值求得平滑数据值:按箱边界值求得平滑数据值:
1. 对数进行从小到大的排序:
1, 6, 8, 10, 15, 18, 24, 25, 41, 67
2. 按等深分箱法分为3箱:
箱1:1, 6, 8, 10
箱2:15, 18, 24, 25
箱3:41, 67
3. 平滑噪声数据的值:
(1)按箱平均值求得平滑数据值:
箱1平均值 = (1+6+8+10)/4 = 6.25
箱2平均值 = (15+18+24+25)/4 = 20.5
箱3平均值 = (41+67)/2 = 54
平滑后的数据为:6.25, 6.25, 6.25, 6.25, 20.5, 20.5, 20.5, 20.5, 54, 54
(2)按箱中值求得平滑数据值:
箱1中值 = (6+8)/2 = 7
箱2中值 = (18+24)/2 = 21
箱3中值 = 41
平滑后的数据为:7, 7, 7, 7, 21, 21, 21, 21, 41, 41
(3)按箱边界值求得平滑数据值:
箱1边界值 = (1+10)/2 = 5.5
箱2边界值 = (15+25)/2 = 20
箱3边界值 = (41+67)/2 = 54
平滑后的数据为:5.5, 5.5, 5.5, 5.5, 20, 20, 20, 20, 54, 54
假设下面是一个超市某种商品连续24个月的销售数据(百元):19,21,16,22,24,27,23.22,21 20,17,16,20,23,18,24,26,25,20,26,23,21,15,17。 使用统一区间(设箱子数为4)对数据分箱,并对分箱后的数据采用边界值法进行平滑。
首先,我们需要对数据进行分箱。将连续的24个月的销售数据分为4个箱子,则每个箱子中有6个月的数据。
其次,对于每个箱子的数据,我们需要使用边界值法进行平滑。边界值法的基本思想是:将每个箱子的数据分别除以2,然后用相邻两个箱子的平均值作为边界值进行平滑。具体步骤如下:
1. 将数据分为4个箱子:
```
[19, 21, 16, 22, 24, 27]
[23, 22, 21, 20, 17, 16]
[20, 23, 18, 24, 26, 25]
[20, 26, 23, 21, 15, 17]
```
2. 对于第一个箱子,我们将其分为两个部分:[19, 21, 16] 和 [22, 24, 27]。将每个部分的数据分别除以2,得到:
```
[9.5, 10.5, 8]
[11, 12, 13.5]
```
3. 对于第二个箱子,我们将其分为两个部分:[23, 22, 21] 和 [20, 17, 16]。将每个部分的数据分别除以2,得到:
```
[11.5, 11, 10.5]
[10, 8.5, 8]
```
4. 对于第三个箱子,我们将其分为两个部分:[20, 23, 18] 和 [24, 26, 25]。将每个部分的数据分别除以2,得到:
```
[10, 11.5, 9]
[12, 13, 12.5]
```
5. 对于第四个箱子,我们将其分为两个部分:[20, 26, 23] 和 [21, 15, 17]。将每个部分的数据分别除以2,得到:
```
[10, 13, 11.5]
[10.5, 7.5, 8.5]
```
6. 最后,我们将每个箱子的边界值和数据进行平滑,得到:
```
[10.75, 11.5, 10.25, 12.25, 12, 13.25]
[10.75, 11, 10.25, 10.5, 9, 8.25]
[11, 12.25, 10.5, 12.5, 12.5, 12.75]
[10.25, 12.5, 11, 9.75, 8.25, 9.5]
```
这就是使用统一区间对数据进行分箱,并采用边界值法进行平滑的过程。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)