Python概率密度与分布函数实例详解

版权申诉

5星 · 超过95%的资源 150 浏览量更新于2024-09-11 3 收藏 122KB PDF 举报

在Python中，计算概率密度、累计分布和逆函数是数据分析和统计建模中常见的任务。本文将介绍如何利用scipy库中的函数来实现这些计算，这对于理解和处理各种随机变量的概率特性至关重要。首先，让我们了解scipy.stats模块，它提供了丰富的概率分布函数。其中，pdf（probability density function）用于连续随机变量，如正态分布，计算特定值的概率密度；pmf（probability mass function）则适用于离散随机变量，例如二项分布和几何分布，给出离散值发生的概率。对于连续分布，例如正态分布，我们可以使用`st.norm.pdf(x)`来获取x处的概率密度，如在标准正态分布中，`st.norm.pdf(0)`返回0处的概率密度值。累计分布函数（cdf，cumulative distribution function）用于计算随机变量小于或等于某个值的概率，`st.norm.cdf(x)`即可得到。例如，`st.norm.cdf(0)`表示标准正态分布中X≤0的概率，`st.norm.cdf([-1, 0, 1])`则返回X≤-1, X≤0, X≤1的概率。累计分布函数的逆函数，即百分位函数（percent point function，ppf），则可以找到对应概率下的临界值，如`st.norm.ppf(p)`计算给定概率p对应的临界值。标准正态分布中，`st.norm.ppf(0.975)`会返回Z值，使得97.5%的数据位于其下方。生存函数（survival function，lsf）是1减去累计分布函数，通常用于描述随机变量超过某个值的概率。生存函数的逆函数就是找到特定生存概率对应的临界值，`st.norm.lsf(p)`即可计算。例如，`st.norm.lsf(0.025)`给出的是使得97.5%的数据大于或等于该值的临界值。对于非标准正态分布，我们可以使用`loc`和`scale`参数调整分布的均值和标准差，如`st.norm.cdf(0, loc=2, scale=1)`表示均值为2、标准差为1的正态分布中X≤0的概率。文章中还展示了二项分布（binomial）、几何分布（geometric）、泊松分布（Poisson）和卡方分布（chi-square）等其他常见随机变量的概率密度函数计算，以及各自逆函数的使用。例如，`st.binom.pmf(k, n, p)`计算在n次独立试验中恰好得到k次成功的二项概率，而`st.geom.pmf(k, p)`计算几何分布中第k次成功的概率。通过掌握这些Python中的概率密度、累计分布和逆函数计算方法，我们可以有效地分析和处理各种随机现象，进行假设检验、参数估计和预测等统计任务。对于想要深入理解Python在概率论和统计分析中的应用的开发者和分析师来说，这篇文章提供了一个实用且详尽的指南。

python 计算概率密度、累计分布、逆函数的例子计算概率密度、累计分布、逆函数的例子

主要介绍了python 计算概率密度、累计分布、逆函数的例子,具有很好的参考价值，希望对大家有所帮助。一起

跟随小编过来看看吧

计算概率分布的相关参数时，一般使用计算概率分布的相关参数时，一般使用 scipy 包，常用的函数包括以下几个：包，常用的函数包括以下几个：

pdf：连续随机分布的概率密度函数

pmf：离散随机分布的概率密度函数

cdf：累计分布函数

百分位函数（累计分布函数的逆函数）

生存函数的逆函数（1 - cdf 的逆函数）

函数里面不仅能跟一个数据，还能跟一个数组。下面用正态分布举例说明：

>>> import scipy.stats as st

>>> st.norm.cdf(0) # 标准正态分布在 0 处的累计分布概率值

0.5

>>> st.norm.cdf([-1, 0, 1])# 标准正态分布分别在 -1， 0， 1 处的累计分布概率值

array([0.15865525, 0.5, 0.84134475])

>>> st.norm.pdf(0) # 标准正态分布在 0 处的概率密度值

0.3989422804014327

>>> st.norm.ppf(0.975)# 标准正态分布在 0.975 处的逆函数值

1.959963984540054

>>> st.norm.lsf(0.975)# 标准正态分布在 0.025 处的生存函数的逆函数值

1.959963984540054

对于非标准正态分布，通过更改参数 loc 与 scale 来改变均值与标准差：

>>> st.norm.cdf(0, loc=2, scale=1) # 均值为 2，标准差为 1 的正态分布在 0 处的累计分布概率值

0.022750131948179195

对于其他随机分布，可能更改的参数不一样，具体需要查官方文档。下面我们举一些常用分布的例子：

>>> st.binom.pmf(4, n=100, p=0.05) # 参数值 n=100, p=0.05 的二项分布在 4 处的概率密度值

0.17814264156968956

>>> st.geom.pmf(4, p=0.05) # 参数值 p=0.05 的几何分布在 4 处的概率密度值

0.04286875

>>> st.poisson.pmf(2, mu=3) # 参数值 mu=3 的泊松分布在 2 处的概率密度值

0.22404180765538775

>>> st.chi2.ppf(0.95, df=10) # 自由度为 10 的卡方分布在 0.95 处的逆函数值

18.307038053275146

>>> st.t.ppf(0.975, df=10) # 自由度为 10 的 t 分布在 0.975 处的逆函数值

2.2281388519649385

>>> st.f.ppf(0.95, dfn=2, dfd=12) # 自由度为 2, 12 的 F 分布在 0.95 处的逆函数值

3.8852938346523933

补充拓展：给定概率密度补充拓展：给定概率密度,生成随机数生成随机数 python实现实现

实现的方法可以不止一种：

rejection sampling

invert the cdf

Metropolis Algorithm (MCMC)

本篇介绍根据累积概率分布函数的逆函数(2：invert the CDF)生成的方法。

自己的理解不一定正确，有错误望指正。

目标：目标：

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38647925

粉丝: 2
资源: 913

Python概率密度与分布函数实例详解

Python概率分布大全（含可视化）

从txt文本中读取数据，python作概率密度函数图像

高斯函数及其反函数求法

python高斯分布概率密度函数的使用详解

使用Python模拟估计概率密度函数

python函数，已有概率密度函数，求该符合概率密度函数分布的一个数组

python威布尔概率密度分布

python中likelihood是计算概率密度函数的吗

python根据概率密度函数

python画概率密度函数

最新资源