835 字
4 分钟
[工科概率论] 随机变量函数的分布

本节用于解决已知随机变量XX的分布,求随机变量Y=g(X)Y = g(X)的分布的问题

离散型随机变量#

离散的简单,一个例题就能看懂了

e.g. 已知随机变量XX的分布如下表:

xix_i-1123
pip_i0.20.20.30.3

求随机变量Y=X2Y = X^2的分布

解:

先算YY的可能取值: y1=(1)2=1y_1 = (-1)^2 = 1y2=12=1y_2 = 1^2 = 1y3=22=4y_3 = 2^2 = 4y4=32=9y_4 = 3^2 = 9

把重复的值合并,概率相加,得到YY的可能取值为:{1,4,9}\{1, 4, 9\}

yjy_j149
pjp_j0.40.30.3

连续型随机变量#

用到的方法有分布函数法公式法

分布函数法#

e.g. 已知XN(μ,σ2)X \sim N(\mu, \sigma^2),求Y=XμσY = \dfrac{X - \mu}{\sigma}的概率密度

解:

先求YY的分布函数:

FY(y)=P(Yy)=P(Xμσy)=P(Xσy+μ)=FX(σy+μ)\begin{aligned} F_Y(y) &= P(Y \le y) = P\left(\frac{X - \mu}{\sigma} \le y\right) \\ &= P(X \le \sigma y + \mu) \\ &= F_X(\sigma y + \mu) \end{aligned}

如果已知XX的分布函数FX(x)F_X(x),也可以代入得到YY的分布函数FY(y)F_Y(y)再求导得fY(y)f_Y(y)(记得要把FX(x)F_X(x)的区间也带入)但这道例题正态分布的分布函数没有解析式,所以接下来直接求导得到密度函数

将上式两侧分别对yy求导,得到YY的密度函数:

fY(y)=FY(y)=FX(σy+μ)σ=fX(σy+μ)σ\begin{aligned} f_Y(y) &= F_Y^{\prime}(y) = F_X^{\prime}(\sigma y + \mu) \cdot \sigma \\ &= f_X(\sigma y + \mu) \cdot \sigma \end{aligned}

fX(x)f_X(x)为已知的正态分布密度函数,代入上式即可得到YY的密度函数:

fY(y)=12πey22f_Y(y) =\large \dfrac{1}{\sqrt{2 \pi}} e^{\large -\frac{y^2}{2}}

公式法#

XX为连续型随机变量,Y=g(X)Y = g(X),且g(x)g(x)为区间(a,b)(a,b)上的单调可微函数,则Y=g(X)Y=g(X)的概率密度为:

fY(y)={fX(h(y))h(y),A<y<B0,其他\large f_Y(y) = \begin{cases} \large f_X(h(y)) |h^{\prime} (y)|, \quad A<y<B \\[1.5em] 0, \quad \text{其他} \end{cases}

其中,h(y)h(y)g(x)g(x)的反函数,A=min{g(a),g(b)}A = \min\{g(a), g(b)\}B=max{g(a),g(b)}B = \max\{g(a), g(b)\}

e.g. 对球的直径进行测量,设其值XX在区间(a,b)(a,b)上服从均匀分布,求球的体积YY的概率密度

解:

先写出XX的密度函数:

fX(x)={1ba,a<x<b0,其他f_X(x) = \begin{cases} \dfrac{1}{b-a}, \quad a < x < b \\[1.5em] 0, \quad \text{其他} \end{cases}

球的体积YY与直径XX的关系为: Y=g(X)=π6X3Y = g(X) = \dfrac{\pi}{6} X^3

y=π6x3a<x<by = \dfrac{\pi}{6} x^3 \quad a<x<b

可见这是一个单调可微函数,接下来求反函数h(y)h(y)x=h(y)=6yπ3π6a3<y<π6b3x = h(y) = \sqrt[3]{\dfrac{6y}{\pi}} \quad \dfrac{\pi}{6}a^3 < y < \dfrac{\pi}{6}b^3

所以:

fY(y)=fX(h(y))h(y)=1ba29π3y23\large f_Y(y) = f_X(h(y)) |h^{\prime}(y)| = \frac{1}{b-a} \sqrt[3]{\frac{2}{9 \pi}} y^{\large -\frac{2}{3}}

g(x)g(x)分段单调时#

可将区间(a,b)(a,b)划分为若干个单调区间,分别求出各区间对应的密度函数,然后将各区间的密度函数相加

此处约定对于使得反函数hi(y)h_i(y)无意义的yy值,fX(hi(y))hi(y)=0f_X(h_i(y)) |h_i^{\prime}(y)| = 0

即不离散也不连续的随机变量#

e.g. 已知随机变量XX的概率密度为:

fX(x)={1ax2,0<x<30,其他f_X(x) = \begin{cases} \dfrac{1}{a}x^2, \quad 0 < x < 3 \\[1.5em] 0, \quad \text{其他} \end{cases}

令随机变量YY为:

Y={2,X1X,1<X<21,X2Y = \begin{cases} 2, \quad X \le 1 \\[1em] X, \quad 1 < X < 2 \\[1em] 1, \quad X \ge 2 \end{cases}

YY的分布函数

解:

因为fX(x)f_X(x)的总面积是1,所以aa是可以确定的:

+fX(x)dx=031ax2dx=1a03x2dx=1a273=9a=1a=9\int_{-\infty}^{+\infty} f_X(x) \, dx = \int_{0}^{3} \frac{1}{a}x^2 \, dx = \frac{1}{a} \int_{0}^{3} x^2 \, dx = \frac{1}{a} \cdot \frac{27}{3} = \frac{9}{a} = 1 \Rightarrow a = 9

可得YYDe

FY(y)F_Y(y)YY的分布函数,则:

y<1y < 1时,FY(y)=P(Yy)=0F_Y(y)= P(Y \le y) = 0

y2y \ge 2时,FY(y)=P(Yy)=1F_Y(y)= P(Y \le y) = 1

1y<21 \le y < 2时,

FY(y)=P(Yy)=P(Y=1)+P(1<Yy)=P(X2)+P(1<Xy)=2319x2dx+1y19x2dx=y3+1827\begin{aligned} F_Y(y) &= P(Y \le y) = P(Y=1) + P(1<Y \le y) \\ &= P(X \ge 2) + P(1 < X \le y) \\ &= \int_{2}^{3} \frac{1}{9} x^2 \, dx + \int_{1}^{y} \frac{1}{9} x^2 \, dx \\[1.5em] &= \frac{y^3 + 18}{27} \end{aligned}
[工科概率论] 随机变量函数的分布
https://a1kari8.github.io/posts/probability_theory/dist_rv_func/
作者
A1kari8
发布于
2025-11-23
许可协议
CC BY-NC-SA 4.0