x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) x.sort() w = int(input("请输入等宽分箱的宽度:")) max = x.max() min = x.min() m = int(math.ceil((max - min)/w)) bins = [min + k*w for k in range(0,m + 1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m-1): for bin, count in number.items(): for i in range(count): if a < size: width[j][i] = x[a] a += 1 else: break # exit loop if no more values in x print(width) 输出结果
时间: 2023-05-25 17:05:07 浏览: 45
这段代码实现的是等宽分箱的功能,将数组x中的数字按照输入的宽度w分成若干个箱子,然后返回每个箱子中数字的数量,以及每个箱子内数字的具体值,最后将这些信息储存在number和width两个变量中。具体思路为:
1. 对数组x进行排序。
2. 根据输入的宽度w和x中的最大值与最小值,计算出需要分成多少个箱子m,并将这些箱子的边界储存在bins中。
3. 使用pd.cut函数将x中的数字按照bins中的边界分入不同的箱子中,返回的结果为x_cuts。
4. 对x_cuts中每个箱子内数字的数量进行统计,返回结果储存在number中。
5. 获取number中最多的数字数量rows,以及需要创建的二维数组宽度m。
6. 创建一个二维数组width,将width的每一行填充为0,然后按顺序将x中的数字放入width中,直到所有的数字都放入了某个箱子中为止。最后返回width。
相关问题
优化这段代码x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) max_value = x.max() min_value = x.min() m = int(math.ceil((max_value - min_value)/w)) bins = [min_value+k*w for k in range(0, m+1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m): for i in range(0, array[j]): width[j][i] = x[a] a = a + 1 mid_width = np.full([m, rows], 0) for i in range(0, m): for j in range(0, array[i]): mid_width[i][j] = np.median(width[i]) print(mid_width)
x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372])
max_value = x.max()
min_value = x.min()
m = int(math.ceil((max_value - min_value)/w))
bins = [min_value + k*w for k in range(0, m+1)] # fixed missing +1 in range and added space after comma
x_cuts = pd.cut(x, bins, right=False)
number = pd.value_counts(x_cuts)
array = number.values
rows = number.max()
width = np.zeros([m, rows]) # replaced full with zeros since we are setting values anyway
a = 0
for j in range(m): # removed unnecessary 0
for i in range(array[j]): # removed unnecessary 0
width[j][i] = x[a]
a += 1
mid_width = np.full([m, rows], 0)
for i in range(m): # removed unnecessary 0
for j in range(array[i]): # removed unnecessary 0
mid_width[i][j] = np.median(width[i])
print(mid_width) # removed unnecessary space
import numpy as np import math x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) x.sort() x=5 max_value = x.max() min_value = x.min() m = int(math.ceil((max_value - min_value)/w)) bins = [min_value+k*w for k in range(0, m+1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m): for i in range(0, array[j]): width[j][i] = x[a] a = a + 1 mid_width = np.full([m, rows], 0) for i in range(0, m): for j in range(0, array[i]): mid_width[i][j] = np.median(width[i]) print("\n中值平滑后的等宽箱:") print(mid_width) 输出结果与预期不符。帮我找出问题
您的代码中有几个问题:
1. 在第 6 行,您将 `x` 设置为 5,但这将覆盖原始数据。应该删除此行。
2. 在第 7 行,您将 `max_value` 和 `min_value` 分别设置为 `x.max()` 和 `x.min()`,但这两个值应该是数据的最大值和最小值,而不是排序后的最大值和最小值。应该改为 `max_value = max(x)` 和 `min_value = min(x)`。
3. 在第 10 行,您将 `bins` 列表初始化为 `[min_value k*w for k in range(0, m 1)]`,但这个表达式有语法错误。应该改为 `[min_value + k*w for k in range(0, m+1)]`,这将生成 `m+1` 个边界,最后一个边界是数据的最大值。
4. 在第 12 行,您使用了 `pd.cut` 函数来将数据分成箱子,但您没有导入 Pandas 库。应该添加 `import pandas as pd`。
5. 在第 14 行,您使用了 `pd.value_counts` 函数来计算每个箱子中的数据数量,但此函数返回的是一个 Pandas Series 对象,而不是一个 NumPy 数组。应该使用 `number.values` 将其转换为 NumPy 数组。
6. 在第 17 行,您使用了 `np.full` 函数来创建一个二维 NumPy 数组,但您没有指定数组的数据类型。应该将其改为 `np.full([m, rows], 0, dtype=int)`,这将创建一个整数类型的数组。
7. 在第 19 行,您使用了 `a = a 1` 来递增变量 `a` 的值,但这个语句有语法错误。应该改为 `a = a + 1`。
8. 在第 21 行,您使用了 `np.median` 函数来计算每个箱子的中位数,但您没有指定 `axis` 参数,因此它将计算整个数组的中位数。应该将其改为 `np.median(width[i][:array[i]])`,这将只计算当前箱子中的数据的中位数。
修改后的代码如下:
```
import numpy as np
import pandas as pd
import math
x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372])
max_value = max(x)
min_value = min(x)
w = 50
m = int(math.ceil((max_value - min_value) / w))
bins = [min_value + k * w for k in range(0, m + 1)]
x_cuts = pd.cut(x, bins, right=False)
number = pd.value_counts(x_cuts)
array = number.values
rows = number.max()
width = np.full([m, rows], 0, dtype=int)
size = x.size
a = 0
for j in range(0, m):
for i in range(0, array[j]):
width[j][i] = x[a]
a = a + 1
mid_width = np.full([m, rows], 0, dtype=int)
for i in range(0, m):
for j in range(0, array[i]):
mid_width[i][j] = np.median(width[i][:array[i]])
print("\n中值平滑后的等宽箱:")
print(mid_width)
```
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)