独立性条件#
P(AB)=P(A)P(B)f(x,y)=fX(x)fY(y)F(x,y)=FX(x)FY(y)
全概率公式#
P(B)=i=1∑nP(Ai)P(B∣Ai)
贝叶斯公式#
P(Ai∣B)=∑j=1nP(Aj)P(B∣Aj)P(Ai)P(B∣Ai)
离散分布#
二项分布#
X∼B(n,p)E(X)=npD(X)=np(1−p)泊松分布#
X∼Po(λ)或者是P(λ)f(x)=x!λxe−λx=0,1,2,…E(X)=λD(X)=λ几何分布#
X∼G(p)E(X)=p1D(X)=p21−p超几何分布#
X∼H(N,M,n)E(X)=nNMD(X)=nNMNN−MN−1N−n
泊松近似二项分布#
当n很大且p很小时,np=λ,则有
P(X=k)≈k!λke−λ查表得
连续分布#
正态分布#
X∼N(μ,σ2)f(x)=2πσ1exp(−2σ2(x−μ)2)E(X)=μD(X)=σ2指数分布#
X∼E(λ)f(x)=λe−λxx≥0F(x)=1−e−λxx≥0E(X)=λ1D(X)=λ21均匀分布#
X∼U(a,b)f(x)=b−a1E(X)=2a+bD(X)=12(b−a)2
独立可加性#
正态分布泊松分布概率相同的二项分布卡方分布N(μ1,σ12)+N(μ2,σ22)=N(μ1+μ2,σ12+σ22)Po(λ1)+Po(λ2)=Po(λ1+λ2)B(n1,p)+B(n2,p)=B(n1+n2,p)χ2(n1)+χ2(n2)=χ2(n1+n2)
二维正态分布#
f(x,y)E(X)E(Y)D(X)D(Y)Cov(X,Y)=2πσXσY1−ρ21exp(−2(1−ρ2)1[σX2(x−μX)2−σXσY2ρ(x−μX)(y−μY)+σY2(y−μY)2])=μX=μY=σX2=σY2=ρσXσY
分布函数与概率密度函数#
分布函数需要满足的条件#
- F(x)单调不减
- F(−∞)=0,F(+∞)=1
- F(x)右连续
概率密度函数需要满足的条件#
- f(x)≥0 恒大于等于0
- ∫−∞+∞f(x)dx=1 积分为1
- F(x)=∫−∞xf(t)dt
- f(x)=dxdF(x)
随机变量的函数#
公式法#
y=g(x) 在(a,b) 单调, x=h(y) 为其反函数, 则
fY(y)=fX(h(y))∣h′(y)∣,y∈(min{g(a),g(b)},max{g(a),g(b)})
二维随机变量的函数#
卷积法#
fX+Y(z)=∫−∞+∞fX(x)fY(z−x)dxfX+Y(z)=∫−∞+∞fX,Y(x,z−x)dx
数字特征#
E(X)=∫−∞+∞xf(x)dxE(Xdiscrete)=i∑xipi期望运算#
E[aX+bY+c]=aE(X)+bE(Y)+c当X和Y独立时,有
E(XY)=E(X)E(Y)D(X)=E[(X−E(X))2]=E(X2)−[E(X)]2D(X)=∫−∞+∞(x−E(X))2f(x)dxD(Xdiscrete)=i∑(xi−E(X))2pi方差运算#
D[aX+bY+c]=a2D(X)+b2D(Y)+2abCov(X,Y)协方差#
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)Cov(aX+b,cY+d)=acCov(X,Y)Cov(X1+X2,Y1+Y2)=Cov(X1,Y1)+Cov(X1,Y2)+Cov(X2,Y1)+Cov(X2,Y2)D(X)=Cov(X,X)相关系数#
ρXY=D(X)D(Y)Cov(X,Y)
大数定律#
马尔可夫不等式#
P(X≥ε)≤εE(X)切比雪夫不等式#
纯套公式,看见P(∣X−E(X)∣≥ε)的形式就想这个,有的时候期望是0会比较隐蔽,如果给的是<号,就用1减去
P(∣X−E(X)∣≥ε)≤ε2D(X)伯努利大数定律#
看见n重伯努利试验的时候用,Yn表示成功次数,p表示成功概率
n→∞limP(nYn−p≥ε)=0切比雪夫大数定律#
如果有大量同分布且独立的随机变量X1,X2,…,Xn就用这个
n→∞limP(n1i=1∑nXi−μ≥ε)=0辛钦大数定律#
其实跟切比雪夫大数定律是一样的,只不过放宽了条件,只要有相同的期望就行,不要求方差相等
,实际上是因为上面的切比雪夫大数定律的推论证明的过程中假定了方差相等
中心极限定理#
独立同分布中心极限定理#
独立同分布的随机变量X1,X2,…,Xn,期望为μ,方差为σ2,则当n充分大时,随机变量就近似服从正态分布
棣莫弗-拉普拉斯中心极限定理(n重伯努利试验)#
n重伯努利分布B(n,p)近似服从正态分布N(np,np(1−p))
三大分布#
χ2分布#
有n个相互独立的标准正态分布随机变量X1,X2,…,Xn,则随机变量
Y=i=1∑nXi2∼χ2(n)χ2(n)表示自由度为n的卡方分布
重要结论:均值和方差
E(Y)=nD(Y)=2n概率怎么看#
P(χ2(n)>χα2(n))=αχα2(n)通过查表得到, 是横轴上的值t分布#
由X∼N(0,1)和Y∼χ2(n)构成
T=Y/nX∼t(n)t(n)表示自由度为n的t分布
重要性质:对称 tα(n)=−t1−α(n)
P(t(n)>tα(n))=αtα(n)通过查表得到F分布#
由X∼χ2(n1)和Y∼χ2(n2)构成
F=(Y/n2)(X/n1)∼F(n1,n2)重要性质:
F1−α(n1,n2)=Fα(n2,n1)1F(n1,n2)表示自由度为(n1,n2)的F分布,n1叫第一自由度,n2叫第二自由度
P(F(n1,n2)>Fα(n1,n2))=αFα(n1,n2)通过查表得到
统计量#
k阶矩#
Ak=n1i=1∑nXikk=1时为样本均值
k阶中心距#
Bk=n1i=1∑n(Xi−X)kk=2时不是样本方差,称为样本二阶中心距,表示为S∗2
样本方差#
S2=n−11i=1∑n(Xi−X)2这才是样本方差,注意是除以n−1,而不是n,它是σ2的无偏估计
WARNING接下来这两个必须得背,基本上是没法现推出来的
正态总体样本方差的分布#
必须是正态分布才能用
σ2(n−1)S2∼χ2(n−1)可用这个稍微变形得到样本二阶中心距的分布
正态总体样本标准差的分布#
S(X−μ)n∼t(n−1)
参数估计#
矩估计法#
算一、二…阶矩α1,α2,…,然后解方程组就能得到参数估计值,注意利用题里给的已知信息如均值、方差等,矩中间接包含了这些信息可用于解方程
最大似然估计法#
先写出似然函数L(θ)
L(θ)=i=1∏nf(xi;θ)如果似然函数不连续,则应根据极大值出现在区间端点的原则,分别求出各个端点处的函数值,再比较大小,取最大值对应的θ值
若似然函数中无x,则根据x的取值范围,直接写出θ的取值范围,取最大值对应的θ值
其余情况,取对数似然函数并对θ求导,令导数为0,解方程得到参数估计值
解该方程dθdlnL(θ)=0总之是求让L(θ)最大的θ值作为估计θ^
估计评定#
无偏性#
算估计量的均值,如果正好等于θ,则该估计量是无偏的
E(θ^)=θ有效性#
需要无偏性作为前提,如果不是无偏的谈有效性没意义
设有两个估计θ1和θ2,如果对于所有的θ都有
Dθ(θ1)≤Dθ(θ2)且至少有一个参数值θ使小于号成立,则称估计量θ1比估计量θ2更有效
直观上理解就是方差更小的估计量更有效
相合性#
有n个估计量θ^n,如果
∀ε>0,n→∞limP(∣θ^n−θ∣≥ε)=0则称估计量θ^n是参数θ的相合(一致)估计量
区间估计#
1−α叫置信水平,α叫显著性水平
区间估计就三种情况:
已知σ2求μ#
用正态分布
u=σ/nx−μ∼N(0,1)P(−uα/2<u<uα/2)=1−α把已知的全代入解出μ的范围就是置信区间,uα/2通过查表得到
未知σ2求μ#
用t分布
t=s/nx−μ∼t(n−1)P(−tα/2(n−1)<t<tα/2(n−1))=1−α同样都代进去查表
求σ2#
用卡方分布
χ2=σ2(n−1)s2∼χ2(n−1)P(χ1−α/22(n−1)<χ2<χα/22(n−1))=1−α
双样本均值差的区间估计#
已知σ12 = σ22求μ1−μ2#
用t分布
t=n1σ12+n2σ22(x1−x2)−(μ1−μ2)∼t(n1+n2−2)P(−tα/2(n1+n2−2)<t<tα/2(n1+n2−2))=1−α求σ22σ12#
用F分布
F=s22/σ22s12/σ12∼F(n1−1,n2−1)P(F1−α/2(n1−1,n2−1)<F<Fα/2(n1−1,n2−1))=1−α
重要结论#
标准正态分布的矩#
奇数阶矩#
因为ϕ(x)是偶函数,所以奇数阶矩全为0
E(X2k+1)=0偶数阶矩#
E(X2k)=(2k−1)!!=2kk!(2k)!
!!是双阶乘,5!! = 5 × 3 × 1
快速求aX的概率密度函数#
faX(ω)=∣a∣1fX(aω)高斯积分#
∫−∞+∞e−λx2dx=λπ(λ>0)∫−∞+∞e−λx2dx=Γ(21)λ−21(λ>0)Γ(21)=πnΓ(n)=Γ(n+1)