2170 字
11 分钟
[工科概率论] 速记表

独立性条件#

P(AB)=P(A)P(B)f(x,y)=fX(x)fY(y)F(x,y)=FX(x)FY(y)\begin{aligned} P(AB) = P(A)P(B) \\ f(x,y) = f_X(x) f_Y(y) \\ F(x,y) = F_X(x) F_Y(y) \\ \end{aligned}

全概率公式#

P(B)=i=1nP(Ai)P(BAi)P(B) = \sum_{i=1}^{n} P(A_i) P(B|A_i)

贝叶斯公式#

P(AiB)=P(Ai)P(BAi)j=1nP(Aj)P(BAj)P(A_i|B) = \frac{P(A_i) P(B|A_i)}{\sum_{j=1}^{n} P(A_j) P(B|A_j)}

离散分布#

二项分布#

XB(n,p)E(X)=npD(X)=np(1p)X \sim B(n,p) \\[1em] E(X) = np \\[1em] D(X) = np(1-p)

泊松分布#

XPo(λ)或者是P(λ)f(x)=λxeλx!x=0,1,2,E(X)=λD(X)=λX \sim Po(\lambda) \quad \text{或者是} P(\lambda) \\[1em] f(x) = \frac{\lambda^x e^{-\lambda}}{x!} \quad x = 0,1,2,\ldots \\[1em] E(X) = \lambda \\[1em] D(X) = \lambda

几何分布#

XG(p)E(X)=1pD(X)=1pp2X \sim G(p) \\[1em] E(X) = \frac{1}{p} \\[1em] D(X) = \frac{1-p}{p^2}

超几何分布#

XH(N,M,n)E(X)=nMND(X)=nMNNMNNnN1X \sim H(N,M,n) \\[1em] E(X) = n \frac{M}{N} \\[1em] D(X) = n \frac{M}{N} \frac{N-M}{N} \frac{N-n}{N-1}

泊松近似二项分布#

nn很大且pp很小时,np=λnp = \lambda,则有

P(X=k)λkeλk!P(X=k) \approx \frac{\lambda^k e^{-\lambda}}{k!}

查表得

连续分布#

正态分布#

XN(μ,σ2)f(x)=12πσexp((xμ)22σ2)E(X)=μD(X)=σ2X \sim N(\mu, \sigma^2) \\[1em] f(x) = \frac{1}{\sqrt{2 \pi} \sigma} \exp \left( -\frac{(x-\mu)^2}{2 \sigma^2} \right) \\[1em] E(X) = \mu \\[1em] D(X) = \sigma^2

指数分布#

XE(λ)f(x)=λeλxx0F(x)=1eλxx0E(X)=1λD(X)=1λ2X \sim E(\lambda) \\[1em] f(x) = \lambda e^{-\lambda x} \quad x \geq 0 \\[1em] F(x) = 1 - e^{-\lambda x} \quad x \geq 0 \\[1em] E(X) = \frac{1}{\lambda} \\[1em] D(X) = \frac{1}{\lambda^2}

均匀分布#

XU(a,b)f(x)=1baE(X)=a+b2D(X)=(ba)212X \sim U(a,b) \\[1em] f(x) = \frac{1}{b-a} \\[1em] E(X) = \frac{a+b}{2} \\[1em] D(X) = \frac{(b-a)^2}{12}

独立可加性#

正态分布N(μ1,σ12)+N(μ2,σ22)=N(μ1+μ2,σ12+σ22)泊松分布Po(λ1)+Po(λ2)=Po(λ1+λ2)概率相同的二项分布B(n1,p)+B(n2,p)=B(n1+n2,p)卡方分布χ2(n1)+χ2(n2)=χ2(n1+n2)\begin{aligned} \text{正态分布} \quad &N(\mu_1, \sigma_1^2) + N(\mu_2, \sigma_2^2) = N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) \\[1em] \text{泊松分布} \quad &Po(\lambda_1) + Po(\lambda_2) = Po(\lambda_1 + \lambda_2) \\[1em] \text{概率相同的二项分布} \quad &B(n_1, p) + B(n_2, p) = B(n_1 + n_2, p) \\[1em] \text{卡方分布} \quad &\chi^2(n_1) + \chi^2(n_2) = \chi^2(n_1 + n_2) \end{aligned}

二维正态分布#

f(x,y)=12πσXσY1ρ2exp(12(1ρ2)[(xμX)2σX22ρ(xμX)(yμY)σXσY+(yμY)2σY2])E(X)=μXE(Y)=μYD(X)=σX2D(Y)=σY2Cov(X,Y)=ρσXσY\begin{aligned} f(x,y) &= \frac{1}{2 \pi \sigma_X \sigma_Y \sqrt{1-\rho^2}} \exp \left( -\frac{1}{2(1-\rho^2)} \left[ \frac{(x-\mu_X)^2}{\sigma_X^2} - \frac{2 \rho (x-\mu_X)(y-\mu_Y)}{\sigma_X \sigma_Y} + \frac{(y-\mu_Y)^2}{\sigma_Y^2} \right] \right) \\[1em] E(X) &= \mu_X \\[1em] E(Y) &= \mu_Y \\[1em] D(X) &= \sigma_X^2 \\[1em] D(Y) &= \sigma_Y^2 \\[1em] Cov(X,Y) &= \rho \sigma_X \sigma_Y \end{aligned}

分布函数与概率密度函数#

分布函数需要满足的条件#

  1. F(x)F(x)单调不减
  2. F()=0,F(+)=1F(-\infty) = 0, \quad F(+\infty) = 1
  3. F(x)F(x)右连续

概率密度函数需要满足的条件#

  1. f(x)0f(x) \geq 0 恒大于等于0
  2. +f(x)dx=1\int_{-\infty}^{+\infty} f(x) \, dx = 1 积分为1
  3. F(x)=xf(t)dtF(x) = \int_{-\infty}^{x} f(t) \, dt
  4. f(x)=ddxF(x)f(x) = \frac{d}{dx} F(x)

随机变量的函数#

公式法#

y=g(x)y = g(x)(a,b)(a,b) 单调, x=h(y)x = h(y) 为其反函数, 则

fY(y)=fX(h(y))h(y),y(min{g(a),g(b)},max{g(a),g(b)})f_Y(y) = f_X(h(y)) |h'(y)|, \quad y \in (\min \left \{g(a), g(b) \right \} , \max \left \{g(a), g(b) \right \})

二维随机变量的函数#

卷积法#

fX+Y(z)=+fX(x)fY(zx)dxfX+Y(z)=+fX,Y(x,zx)dxf_{X+Y}(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) \, dx \\[1em] f_{X+Y}(z) = \int_{-\infty}^{+\infty} f_{X,Y}(x, z-x) \, dx

二重积分法#

省略

数字特征#

期望#

E(X)=+xf(x)dxE(Xdiscrete)=ixipiE(X) = \int_{-\infty}^{+\infty} x f(x) \, dx \\[1em] E(X_{discrete}) = \sum_{i} x_i p_i

期望运算#

E[aX+bY+c]=aE(X)+bE(Y)+cE[aX + bY + c] = aE(X) + bE(Y) + c

XXYY独立时,有

E(XY)=E(X)E(Y)E(XY) = E(X) E(Y)

方差#

D(X)=E[(XE(X))2]=E(X2)[E(X)]2D(X)=+(xE(X))2f(x)dxD(Xdiscrete)=i(xiE(X))2piD(X) = E[(X - E(X))^2] = \boxed{E(X^2) - [E(X)]^2} \\[1em] D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x) \, dx \\[1em] D(X_{discrete}) = \sum_{i} (x_i - E(X))^2 p_i

方差运算#

D[aX+bY+c]=a2D(X)+b2D(Y)+2abCov(X,Y)D[aX + bY + c] = a^2 D(X) + b^2 D(Y) + 2ab Cov(X,Y)

协方差#

Cov(X,Y)=E[(XE(X))(YE(Y))]=E(XY)E(X)E(Y)Cov(aX+b,cY+d)=acCov(X,Y)Cov(X1+X2,Y1+Y2)=Cov(X1,Y1)+Cov(X1,Y2)+Cov(X2,Y1)+Cov(X2,Y2)D(X)=Cov(X,X)Cov(X,Y) = E[(X - E(X))(Y - E(Y))] = \boxed{E(XY) - E(X)E(Y)} \\[1em] Cov(aX+b, cY+d) = ac Cov(X,Y) \\[1em] Cov(X_1 + X_2, Y_1 + Y_2) = Cov(X_1, Y_1) + Cov(X_1, Y_2) + Cov(X_2, Y_1) + Cov(X_2, Y_2) \\[1em] D(X) = Cov(X,X)

相关系数#

ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}

大数定律#

马尔可夫不等式#

P(Xε)E(X)εP(X \geq \varepsilon) \leq \frac{E(X)}{\varepsilon}

切比雪夫不等式#

纯套公式,看见P(XE(X)ε)P(|X - E(X)| \geq \varepsilon)的形式就想这个,有的时候期望是0会比较隐蔽,如果给的是<<号,就用1减去

P(XE(X)ε)D(X)ε2P(|X - E(X)| \geq \varepsilon) \leq \frac{D(X)}{\varepsilon^2} \\[1em]

伯努利大数定律#

看见nn重伯努利试验的时候用,YnY_n表示成功次数,pp表示成功概率

limnP(Ynnpε)=0\lim_{n \to \infty} P \left( \left| \frac{Y_n}{n} - p \right| \ge \varepsilon \right) = 0

切比雪夫大数定律#

如果有大量同分布且独立的随机变量X1,X2,,XnX_1, X_2, \ldots, X_n就用这个

limnP(1ni=1nXiμε)=0\lim_{n \to \infty} P \left( \left| \frac{1}{n} \sum_{i=1}^{n} X_i - \mu \right| \ge \varepsilon \right) = 0

辛钦大数定律#

其实跟切比雪夫大数定律是一样的,只不过放宽了条件,只要有相同的期望就行,不要求方差相等 ,实际上是因为上面的切比雪夫大数定律的推论证明的过程中假定了方差相等

中心极限定理#

独立同分布中心极限定理#

独立同分布的随机变量X1,X2,,XnX_1, X_2, \ldots, X_n,期望为μ\mu,方差为σ2\sigma^2,则当nn充分大时,随机变量就近似服从正态分布

棣莫弗-拉普拉斯中心极限定理(n重伯努利试验)#

nn重伯努利分布B(n,p)B(n,p)近似服从正态分布N(np,np(1p))N(np, np(1-p))

三大分布#

χ2\chi^2分布#

nn个相互独立的标准正态分布随机变量X1,X2,,XnX_1, X_2, \ldots, X_n,则随机变量

Y=i=1nXi2χ2(n)Y = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)

χ2(n)\chi^2(n)表示自由度为nn的卡方分布

重要结论:均值和方差

E(Y)=nD(Y)=2nE(Y) = n \\[1em] D(Y) = 2n

概率怎么看#

P(χ2(n)>χα2(n))=αχα2(n)通过查表得到, 是横轴上的值P(\chi^2 (n) > \chi^2_{\alpha}(n)) = \alpha \\[1em] \chi^2_{\alpha}(n) \text{通过查表得到, 是横轴上的值}

tt分布#

XN(0,1)X \sim N(0,1)Yχ2(n)Y \sim \chi^2(n)构成

T=XY/nt(n)T = \frac{X}{\sqrt{Y/n}} \sim t(n)

t(n)t(n)表示自由度为nn的t分布

重要性质:对称 tα(n)=t1α(n)t_{\alpha}(n) = -t_{1-\alpha}(n)

P(t(n)>tα(n))=αtα(n)通过查表得到P(t(n) > t_{\alpha}(n)) = \alpha \\[1em] t_{\alpha}(n) \text{通过查表得到}

FF分布#

Xχ2(n1)X \sim \chi^2(n_1)Yχ2(n2)Y \sim \chi^2(n_2)构成

F=(X/n1)(Y/n2)F(n1,n2)F = \frac{(X/n_1)}{(Y/n_2)} \sim F(n_1, n_2)

重要性质:

F1α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1, n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}

F(n1,n2)F(n_1, n_2)表示自由度为(n1,n2)(n_1, n_2)的F分布,n1n_1叫第一自由度,n2n_2叫第二自由度

P(F(n1,n2)>Fα(n1,n2))=αFα(n1,n2)通过查表得到P(F(n_1, n_2) > F_{\alpha}(n_1, n_2)) = \alpha \\[1em] F_{\alpha}(n_1, n_2) \text{通过查表得到}

统计量#

kk阶矩#

Ak=1ni=1nXikA_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k

k=1k=1时为样本均值

kk阶中心距#

Bk=1ni=1n(XiX)kB_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \overline{X})^k

k=2k=2时不是样本方差,称为样本二阶中心距,表示为S2S^{*2}

样本方差#

S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2

这才是样本方差,注意是除以n1n-1,而不是nn,它是σ2\sigma^2无偏估计

WARNING

接下来这两个必须得背,基本上是没法现推出来的

正态总体样本方差的分布#

必须是正态分布才能用

(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

可用这个稍微变形得到样本二阶中心距的分布

正态总体样本标准差的分布#

(Xμ)nSt(n1)\frac{(\overline{X} - \mu)\sqrt{n}}{S} \sim t(n-1)

参数估计#

矩估计法#

算一、二…阶矩α1α2,\alpha_1,\alpha_2, \ldots,然后解方程组就能得到参数估计值,注意利用题里给的已知信息如均值、方差等,矩中间接包含了这些信息可用于解方程

最大似然估计法#

先写出似然函数L(θ)L(\theta)

L(θ)=i=1nf(xi;θ)L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)

如果似然函数不连续,则应根据极大值出现在区间端点的原则,分别求出各个端点处的函数值,再比较大小,取最大值对应的θ\theta

若似然函数中无xx,则根据xx的取值范围,直接写出θ\theta的取值范围,取最大值对应的θ\theta

其余情况,取对数似然函数并对θ\theta求导,令导数为0,解方程得到参数估计值

解该方程ddθlnL(θ)=0\text{解该方程} \quad \frac{d}{d\theta} \ln L(\theta) = 0

总之是求让L(θ)L(\theta)最大的θ\theta值作为估计θ^\hat{\theta}

估计评定#

无偏性#

算估计量的均值,如果正好等于θ\theta,则该估计量是无偏的

E(θ^)=θE(\hat{\theta}) = \theta

有效性#

需要无偏性作为前提,如果不是无偏的谈有效性没意义

设有两个估计θ1\theta_1θ2\theta_2,如果对于所有的θ\theta都有

Dθ(θ1)Dθ(θ2)D_{\theta}(\theta_1) \le D_{\theta}(\theta_2)

且至少有一个参数值θ\theta使小于号成立,则称估计量θ1\theta_1比估计量θ2\theta_2更有效

直观上理解就是方差更小的估计量更有效

相合性#

nn个估计量θ^n\hat{\theta}_n,如果

ε>0,limnP(θ^nθε)=0\forall \varepsilon > 0, \quad \lim_{n \to \infty} P(|\hat{\theta}_n - \theta| \ge \varepsilon) = 0

则称估计量θ^n\hat{\theta}_n是参数θ\theta的相合(一致)估计量

区间估计#

1α1-\alpha叫置信水平,α\alpha叫显著性水平

区间估计就三种情况:

已知σ2\sigma^2μ\mu#

用正态分布

u=xμσ/nN(0,1)P(uα/2<u<uα/2)=1αu = \frac{\overline{x} - \mu}{\sigma / \sqrt{n}} \sim N(0,1)\\[1em] P \left( -u_{\alpha/2} < u < u_{\alpha/2} \right) = 1 - \alpha

把已知的全代入解出μ\mu的范围就是置信区间,uα/2u_{\alpha/2}通过查表得到

未知σ2\sigma^2μ\mu#

用t分布

t=xμs/nt(n1)P(tα/2(n1)<t<tα/2(n1))=1αt = \frac{\overline{x} - \mu}{s / \sqrt{n}} \sim t(n-1)\\[1em] P \left( -t_{\alpha/2}(n-1) < t < t_{\alpha/2}(n-1) \right) = 1 - \alpha

同样都代进去查表

σ2\sigma^2#

用卡方分布

χ2=(n1)s2σ2χ2(n1)P(χ1α/22(n1)<χ2<χα/22(n1))=1α\chi^2 = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)\\[1em] P \left( \chi^2_{1-\alpha/2}(n-1) < \chi^2 < \chi^2_{\alpha/2}(n-1) \right) = 1 - \alpha

双样本均值差的区间估计#

已知σ12\sigma_1^2 = σ22\sigma_2^2μ1μ2\mu_1 - \mu_2#

用t分布

t=(x1x2)(μ1μ2)σ12n1+σ22n2t(n1+n22)P(tα/2(n1+n22)<t<tα/2(n1+n22))=1α\large t = \frac{(\overline{x}_1 - \overline{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\dfrac{\sigma_1^2}{n_1} + \dfrac{\sigma_2^2}{n_2}}} \sim t(n_1 + n_2 - 2 )\\[1em] P \left( -t_{\alpha/2}(n_1 + n_2 - 2) < t < t_{\alpha/2}(n_1 + n_2 - 2) \right) = 1 - \alpha

σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}#

用F分布

F=s12/σ12s22/σ22F(n11,n21)P(F1α/2(n11,n21)<F<Fα/2(n11,n21))=1α\large F = \dfrac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)\\[1em] P \left( F_{1-\alpha/2}(n_1 - 1, n_2 - 1) < F < F_{\alpha/2}(n_1 - 1, n_2 - 1) \right) = 1 - \alpha

重要结论#

标准正态分布的矩#

奇数阶矩#

因为ϕ(x)\phi(x)是偶函数,所以奇数阶矩全为0

E(X2k+1)=0E(X^{2k+1}) = 0

偶数阶矩#

E(X2k)=(2k1)!!=(2k)!2kk!E(X^{2k}) = (2k-1)!! = \frac{(2k)!}{2^k k!}

!!是双阶乘,5!! = 5 × 3 × 1

快速求aXaX的概率密度函数#

faX(ω)=1afX(ωa)f_{aX}(\omega) = \frac{1}{|a|} f_X \left( \frac{\omega}{a} \right)

高斯积分#

+eλx2dx=πλ(λ>0)+eλx2dx=Γ(12)λ12(λ>0)Γ(12)=πnΓ(n)=Γ(n+1)\int_{-\infty}^{+\infty} e^{- \lambda x^2} \,dx = \sqrt{\frac{\pi}{\lambda}} \quad (\lambda > 0) \\[1em] \int_{-\infty}^{+\infty} e^{- \lambda x^2} \,dx = \Gamma \left( \frac{1}{2} \right) \lambda^{-\frac{1}{2}} \quad (\lambda > 0) \\[1em] \Gamma \left( \frac{1}{2} \right) = \sqrt{\pi} \qquad n\Gamma(n) = \Gamma(n+1)
[工科概率论] 速记表
https://a1kari8.github.io/posts/probability_theory/cheat_sheet/
作者
A1kari8
发布于
2025-11-27
许可协议
CC BY-NC-SA 4.0