histogram函数
时间: 2023-10-18 09:19:50 浏览: 104
`histogram()` 函数是用于将数据拆分为一系列等宽的连续区间,并统计每个区间中数据出现的次数。在数据分析和可视化中经常用到。
在 Python 中,可以使用 `numpy` 库的 `histogram()` 函数来实现。该函数的语法如下:
```python
numpy.histogram(a, bins=10, range=None, normed=False, weights=None, density=None)
```
其中,参数的含义如下:
- `a`:表示需要进行统计的数据,可以是一维数组或者是多维数组。
- `bins`:表示将数据拆分为多少个区间,默认为10。
- `range`:表示数据的范围,如果不指定,则使用数据的极值作为范围。
- `normed`:表示是否进行归一化,默认为 `False`。
- `weights`:表示每个数据的权重,默认为 `None`。
- `density`:表示是否将直方图的面积归一化为1,默认为 `None`。
`histogram()` 函数的返回值是一个元组,包含两个数组:
- 第一个数组是每个区间中数据出现的次数,也就是直方图的高度。
- 第二个数组是每个区间的边界值,也就是直方图的横坐标。
以下是一个简单的例子:
```python
import numpy as np
data = np.random.randn(1000) # 生成1000个随机数
hist, bins = np.histogram(data, bins=10, range=(-5, 5))
print(hist) # 输出每个区间中数据出现的次数
print(bins) # 输出每个区间的边界值
```
输出结果如下:
```
[ 0 3 20 87 221 293 233 105 31 7]
[-5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5.]
```
以上代码生成了1000个随机数,并将其拆分为10个区间,每个区间的宽度为1,范围为-5到5。`hist` 数组表示每个区间中数据出现的次数,`bins` 数组表示每个区间的边界值。
阅读全文