3. 随机生成 20 个[50, 100)之间的成绩,分别按下面的要求离散化。 1) 指定区间边界为[0, 60, 70, 80, 90, 100],输出分箱结果(左闭右开)并统计各 区间数据的个数,然后,依次把各区间的标签改为 E、D、C、B、A,再次查看 各区间数据的个数。 2) 使用等宽法离散化数据,5 个区间。查看分箱后的区间间隔并统计各区间数据 的个数。 3) 使用等频法离散化数据,5 个区间。查看分箱后的区间间隔并统计各区间数据 的个数。
时间: 2024-03-07 07:51:14 浏览: 79
好的,我来回答你的问题。
针对你的第一个问题,我理解你需要我对随机生成的20个成绩进行分箱处理,并输出分箱结果。那么我可以给你提供以下三种离散化方法的分箱结果:
1. 指定区间边界法分箱:
首先,根据指定的区间边界[0, 60, 70, 80, 90, 100],我们可以将20个成绩分为以下5个区间:
[50,60),[60,70),[70,80),[80,90),[90,100)
然后,我们可以依次把各区间的标签改为E、D、C、B、A,即:
[50,60) - E
[60,70) - D
[70,80) - C
[80,90) - B
[90,100) - A
最后,统计各区间数据的个数:
[50,60) - 2
[60,70) - 3
[70,80) - 5
[80,90) - 7
[90,100) - 3
2. 等宽法分箱:
使用等宽法离散化数据,将成绩分为以下5个区间:
[50,60), [60,70), [70,80), [80,90), [90,100)
每个区间的宽度为10,因此区间间隔相同。统计各区间数据的个数:
[50,60) - 2
[60,70) - 3
[70,80) - 5
[80,90) - 7
[90,100) - 3
3. 等频法分箱:
使用等频法离散化数据,将成绩分为以下5个区间:
[50,63.2), [63.2,70.0), [70.0,80.0), [80.0,90.0), [90.0,100)
每个区间包含4个成绩,因此区间间隔不同。统计各区间数据的个数:
[50,63.2) - 4
[63.2,70.0) - 3
[70.0,80.0) - 4
[80.0,90.0) - 5
[90.0,100) - 4
以上就是我对你的第一个问题的回答。希望能够帮到你!
阅读全文