如何计算python中正态累积分布函数的反函数



如何计算 Python 中正态分布的累积分布函数 (CDF( 的反比?

我应该使用哪个库?可能是肮脏的?

NORMSNOV(在评论中提到(是标准正态分布的CDF的倒数。 使用 scipy ,您可以使用scipy.stats.norm对象的ppf方法计算此值。 首字母缩略词 ppf 代表百分点函数,这是分位数函数的另一个名称。

In [20]: from scipy.stats import norm
In [21]: norm.ppf(0.95)
Out[21]: 1.6448536269514722

检查它是否是 CDF 的反转:

In [34]: norm.cdf(norm.ppf(0.95))
Out[34]: 0.94999999999999996

默认情况下,norm.ppf使用 mean=0 和 stddev=1,这是"标准"正态分布。 您可以通过分别指定locscale参数来使用不同的均值和标准差。

In [35]: norm.ppf(0.95, loc=10, scale=2)
Out[35]: 13.289707253902945

如果你查看scipy.stats.norm的源代码,你会发现ppf方法最终调用scipy.special.ndtri。 因此,要计算标准正态分布的 CDF 的倒数,您可以直接使用该函数:

In [43]: from scipy.special import ndtri
In [44]: ndtri(0.95)
Out[44]: 1.6448536269514722

ndtrinorm.ppf得多

In [46]: %timeit norm.ppf(0.95)
240 µs ± 1.75 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
In [47]: %timeit ndtri(0.95)
1.47 µs ± 1.3 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)

Python 3.8开始,标准库提供NormalDist对象作为statistics模块的一部分。

它可以用来得到逆累积分布函数(inv_cdf - cdf的反函数(,也称为分位数函数或给定平均值(mu(和标准差(sigma(的百分点函数

from statistics import NormalDist
NormalDist(mu=10, sigma=2).inv_cdf(0.95)
# 13.289707253902943

可以简化为标准正态分布(mu = 0sigma = 1(:

NormalDist().inv_cdf(0.95)
# 1.6448536269514715
# given random variable X (house price) with population muy = 60, sigma = 40
import scipy as sc
import scipy.stats as sct
sc.version.full_version # 0.15.1
#a. Find P(X<50)
sct.norm.cdf(x=50,loc=60,scale=40) # 0.4012936743170763
#b. Find P(X>=50)
sct.norm.sf(x=50,loc=60,scale=40) # 0.5987063256829237
#c. Find P(60<=X<=80)
sct.norm.cdf(x=80,loc=60,scale=40) - sct.norm.cdf(x=60,loc=60,scale=40)
#d. how much top most 5% expensive house cost at least? or find x where P(X>=x) = 0.05
sct.norm.isf(q=0.05,loc=60,scale=40)
#e. how much top most 5% cheapest house cost at least? or find x where P(X<=x) = 0.05
sct.norm.ppf(q=0.05,loc=60,scale=40)

最新更新