x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) x.sort() w = int(input("请输入等宽分箱的宽度：")) max = x.max() min = x.min() m = int(math.ceil((max - min)/w)) bins = [min+k*w for k in range(0,m+1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m): for i in range(0, number[j]): width[j][i] = x[a] a = a + 1 print(width)

时间: 2023-05-25 16:04:32 浏览: 162

这段代码使用等宽分箱的方法将数组 x 分成多个箱子，并计算每个箱子中元素的数量。具体实现过程如下： 1. 首先将数组 x 排序。 2. 用户输入等宽分箱的宽度 w，根据最大值和最小值算出需要分成的箱子数量 m。bins 数组存储每个箱子的边界。 3. 使用 pd.cut 函数，将每个元素分到对应的箱子中，返回一个包含各元素对应箱子的 pd.Series 对象 x_cuts。 4. 使用 pd.value_counts 函数，计算每个箱子中元素的数量，得到一个 pd.Series 对象 number。 5. 为了将每个箱子内元素的值按顺序存放，需要先得到每个箱子中元素最多的数量 rows。我们创建一个二维数组 width，大小为 (m, rows)，用于存放箱子内元素的值。使用 np.full 函数，将数组初始化为 0。 6. 遍历每个箱子，将属于该箱子的元素逐个存入 width 数组。a 记录当前元素的索引，每次存入后将 a 加 1。 7. 打印 width 数组，即可得到每个箱子中元素的顺序。需要注意的是，在比较 max 和 min 时，不应使用 Python 内置的 max 和 min 函数，因为它们也会考虑到数组中的 None 值。我们应该使用 numpy 的 max 和 min 函数，它们会忽略掉 None 值。

优化这段代码x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) max_value = x.max() min_value = x.min() m = int(math.ceil((max_value - min_value)/w)) bins = [min_value+k*w for k in range(0, m+1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m): for i in range(0, array[j]): width[j][i] = x[a] a = a + 1 mid_width = np.full([m, rows], 0) for i in range(0, m): for j in range(0, array[i]): mid_width[i][j] = np.median(width[i]) print(mid_width)

x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) max_value = x.max() min_value = x.min() m = int(math.ceil((max_value - min_value)/w)) bins = [min_value + k*w for k in range(0, m+1)] # fixed missing +1 in range and added space after comma x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.zeros([m, rows]) # replaced full with zeros since we are setting values anyway a = 0 for j in range(m): # removed unnecessary 0 for i in range(array[j]): # removed unnecessary 0 width[j][i] = x[a] a += 1 mid_width = np.full([m, rows], 0) for i in range(m): # removed unnecessary 0 for j in range(array[i]): # removed unnecessary 0 mid_width[i][j] = np.median(width[i]) print(mid_width) # removed unnecessary space

import numpy as np import math x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) x.sort() x=5 max_value = x.max() min_value = x.min() m = int(math.ceil((max_value - min_value)/w)) bins = [min_value+k*w for k in range(0, m+1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.full([m, rows], 0) size = x.size a = 0 for j in range(0, m): for i in range(0, array[j]): width[j][i] = x[a] a = a + 1 mid_width = np.full([m, rows], 0) for i in range(0, m): for j in range(0, array[i]): mid_width[i][j] = np.median(width[i]) print("\n中值平滑后的等宽箱：") print(mid_width) 输出结果与预期不符。帮我找出问题

您的代码中有几个问题： 1. 在第 6 行，您将 `x` 设置为 5，但这将覆盖原始数据。应该删除此行。 2. 在第 7 行，您将 `max_value` 和 `min_value` 分别设置为 `x.max()` 和 `x.min()`，但这两个值应该是数据的最大值和最小值，而不是排序后的最大值和最小值。应该改为 `max_value = max(x)` 和 `min_value = min(x)`。 3. 在第 10 行，您将 `bins` 列表初始化为 `[min_value k*w for k in range(0, m 1)]`，但这个表达式有语法错误。应该改为 `[min_value + k*w for k in range(0, m+1)]`，这将生成 `m+1` 个边界，最后一个边界是数据的最大值。 4. 在第 12 行，您使用了 `pd.cut` 函数来将数据分成箱子，但您没有导入 Pandas 库。应该添加 `import pandas as pd`。 5. 在第 14 行，您使用了 `pd.value_counts` 函数来计算每个箱子中的数据数量，但此函数返回的是一个 Pandas Series 对象，而不是一个 NumPy 数组。应该使用 `number.values` 将其转换为 NumPy 数组。 6. 在第 17 行，您使用了 `np.full` 函数来创建一个二维 NumPy 数组，但您没有指定数组的数据类型。应该将其改为 `np.full([m, rows], 0, dtype=int)`，这将创建一个整数类型的数组。 7. 在第 19 行，您使用了 `a = a 1` 来递增变量 `a` 的值，但这个语句有语法错误。应该改为 `a = a + 1`。 8. 在第 21 行，您使用了 `np.median` 函数来计算每个箱子的中位数，但您没有指定 `axis` 参数，因此它将计算整个数组的中位数。应该将其改为 `np.median(width[i][:array[i]])`，这将只计算当前箱子中的数据的中位数。修改后的代码如下： ``` import numpy as np import pandas as pd import math x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) max_value = max(x) min_value = min(x) w = 50 m = int(math.ceil((max_value - min_value) / w)) bins = [min_value + k * w for k in range(0, m + 1)] x_cuts = pd.cut(x, bins, right=False) number = pd.value_counts(x_cuts) array = number.values rows = number.max() width = np.full([m, rows], 0, dtype=int) size = x.size a = 0 for j in range(0, m): for i in range(0, array[j]): width[j][i] = x[a] a = a + 1 mid_width = np.full([m, rows], 0, dtype=int) for i in range(0, m): for j in range(0, array[i]): mid_width[i][j] = np.median(width[i][:array[i]]) print("\n中值平滑后的等宽箱：") print(mid_width) ```

阅读全文

相关推荐

拉格朗日插值法python 数据预处理（采用拉格朗日插值法处理缺失值）.zip

拉格朗日插值法python运用拉格朗日插值法给空缺数据进行插值，通过调用scipy中的lagrange实现(1).zip

Python numpy线性代数用法实例解析

x = np.array([123,172,76,161,314,77,226,330,202,321,260,155,120,163,221,400,45,106,296,125,210,66,131,242,372]) w = int(input("请输入等宽分箱的宽度：")) max = x.max() min = x.min() m = int(math.ceil((max - min)/w))

、分别使用分段线性插值和样条插值预测 P196 例9.4 中的人口数。课本（第三 版）P202，习题14 数据：← data=[5.3,7.2,9.6,12.9,17.1,23.2,31.4.4 38.6,50.2,62.9,76.0,92.0,106.5,123.2,...4 131.7,150.7,179.3,204.0,226.5,251.4,275.0,308.71

python求解线性方程的解。 x + y + z = 3 2y + 5z = -2 2x + 5y - z = 13.5

dbscan聚类结果保存为{"y":123.2885100,"x":42.7373900,"label":8}格式的json文件

功能函数y=x(1)*x(2)-1500;mu=[38 54];sigma=[3.8 2.7]，用MCMC生成样并用本子集模拟计算失效概率

AttributeError: 'numpy.int64' object has no attribute 'zfill'

详细整理python 字符串(str)与列表(list)以及数组(array)之间的转换方法

Python中numpy的基础用法1

python scipy卷积运算的实现方法

Python的基本语法、常用库以及其在各个领域的应用

大家在看

zlg的Python应用

UART.rar_2407 串口_F2407_TMS320LF2407_uart c语言

cam350导出smt坐标

TA-Lib的whl文件

本科-OOAD-原婷婷-2015212109-188013989281

最新推荐

基于CNN-GRU-Attention混合神经网络的负荷预测方法 附Python代码.rar

,,Induction-Motor-VF-Control：基于MATLAB Simulink的利用V F控制的感应电机调速仿真模型 仿真条件：MATLAB Simulink R2015b ,核心关键

自驾游中如何规划住宿地点.doc

java-springboot+vue酒店管理系统源码（完整前后端+mysql+说明文档+LunW+PPT）.zip

网络文化互动中的虚拟现实技术应用.doc

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练

、分别使用分段线性插值和样条插值预测 P196 例9.4 中的人口数。课本（第三版）P202，习题14 数据：← data=[5.3,7.2,9.6,12.9,17.1,23.2,31.4.4 38.6,50.2,62.9,76.0,92.0,106.5,123.2,...4 131.7,150.7,179.3,204.0,226.5,251.4,275.0,308.71

基于CNN-GRU-Attention混合神经网络的负荷预测方法附Python代码.rar

,,Induction-Motor-VF-Control：基于MATLAB Simulink的利用V F控制的感应电机调速仿真模型仿真条件：MATLAB Simulink R2015b ,核心关键