PDF、PMF、CDF

1. 概念解释

PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

PMF:概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

CDF:累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

2. 数学表示

2.1 PDF

如果XX是连续型随机变量,定义概率密度函数为$f_X(x)$,用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

37283ef29725eae40af42392d7a115a6.png

2.2 PMF

如果XX离散型随机变量,定义概率质量函数为$f_X(x)$,PMF其实就是高中所学的离散型随机变量的分布律,即

ef156c7b36c0068749578ce67a6e8763.png

2.3 CDF

不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

对于连续型随机变量,显然有:

95dcf244dd03aa3873cea2592c007b5a.png

那么CDF就是PDF的积分,PDF就是CDF的导数。

对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为:

c3e3d1b3ea6113f81a6eb2c7dbda97c1.png

Pareto(帕累托)分布

Survial function 生成函数

The survival function is also known as the survivor function[2] or reliability function.[3]

又称 complementary cumulative distribution function.

2c70841bf5f03f5c05533c1fba0560e3.png

其实就是1-CDF

Pareto distribution

1ae6fce2b1f7e95fbb51d10c7d38c9e0.png

注意形状参数$\alpha$必须是正的!

bdfc0e1a43eacf8829ea60f8e308d676.png

3649826936f63d1dec387a76737c2e7f.png

a11d82a780dd5db527cf2d9b5e91ff62.png

Generalized Pareto distribution

180f201504dc8d8137fed42f16b9c01a.png

注意:形状参数(或者称为尾部指数)$\xi\in(-\infty,+\infty)$!

b31d29d789ec4e880d3e7067ed837c6e.png

因此,GP 分布是指数分布 (k = 0) 和帕累托分布 (k>0) 的广义化。GP 将这两个分布包括在更大的族中,因此可以实现连续的形状范围。

Matlab实现

广义帕累托 (GP) 分布是一种右偏态分布,使用形状参数 k 和尺度参数 sigma 进行参数化。k 也称为“尾部指数”参数,可以为正值、零或负值。

x = linspace(0,10,1000);

plot(x,gppdf(x,-.4,1),'-', x,gppdf(x,0,1),'-', x,gppdf(x,2,1),'-');

xlabel('x / sigma');

ylabel('Probability density');

legend({'k < 0' 'k = 0' 'k > 0'});

d55a45e31722d5793942aca0dfd677f3.png

其他代码见链接!

Logo

讨论HarmonyOS开发技术,专注于API与组件、DevEco Studio、测试、元服务和应用上架分发等。

更多推荐