概统 复习随笔
概统复习笔记
两两独立但不相互独立
例1
四张卡牌,分别写有2,3,5,30,随机抽取一张,定义事件A为取出的数字是2的倍数,事件B为取出的数字是3的倍数,事件C为取出的数字是5的倍数,则有
P(A)=P(B)P(AB)=P(BC)P(ABC)=41=P(C)=21=P(CA)=41=21×21=P(A)P(B)P(C)
例2
连续独立抛一枚质地均匀的硬币两次,A代表第一次正面向上,B代表第二次正面向上,C代表一正一反,则
P(A)=P(B)P(AB)=P(BC)P(ABC)=0=P(C)=21=P(CA)=41=21×21=P(A)P(B)P(C)
条件独立与独立无关
条件独立不蕴含独立
对于任意非空事件A,B有:
P(AB∣B)=P(B)P(AB)=P(A∣B)≡P(A∣B)P(B∣B)
因此它们都在条件B下独立,显然不一定A,B独立
独立不蕴含条件独立
对于独立事件A,B,满足C=A∪B⊊Ω,则有:
P(AB∣C)=P(C)P(ABC)=P(C)P(AC)P(BC)=P(C)2P(AC)P(BC)=P(A∣C)P(B∣C)
泊松分布与指数分布
泊松分布P(λ)为离散型分布,其PMF为:
P(X=k)=k!λke−λ
其数字特征为:
E(X)=Var(X)=λ
而指数分布Exp(λ)为连续型分布,其PDF为:
f(x)=λe−λx
其数字特征为:
E(X)=λ1Var(X)=λ21
尾概率为:
P(X>x)=e−λx
指数分布与泊松分布为对同一事件的不同描述,指数分布为两次发生这一事件之间的时间间隔(连续),泊松分布为固定时间段内发生事件的次数(离散)
全期望公式
E(Y)E(E(g(X)Y∣X))=E(E(Y∣X))=E(g(X)E(Y∣X))
条件期望是均方误差意义下的最优预测,即∀g:
E((Y−g(X))2)≥E((Y−E(Y∣X))2)
矩母函数与矩
n阶原点矩为矩母函数的n阶导数
E(Xn)=MX(n)(0)
相对应的标准矩为:
E((X−μ)n)=k=0∑nCnkE(Xk)μn−k=k=0∑nCnkMX(n)(0)μn−k
概率不等式
Markov
若随机变量X≥0,则∀a>0
P(X≥a)≤aE(X)
Chebyshev
若随机变量X方差存在,则:
P(∣X−E(X)∣≥a)≤a2Var(X)
Chernoff
X任意,则∀a>0,t>0
P(X≥a)≥etaE(etX)
Hoeffding bound
随机变量列Xi∈[ai,bi],记X=i=1∑nXi,并记μ=E(X),则:
P(X≤μ−t)P(X≥μ+t)≤exp(−i=1∑n(ai−bi)22t2)≤exp(−i=1∑n(ai−bi)22t2)
随机变量列Xi∈[0,1],记X=i=1∑nXi,并记μ=E(X),则:
P(X≤(1−ε)μ)P(X≥(1+ε)μ)≤exp(−2ε2μ)≤exp(−2+εε2μ)
收敛性的差异
Ω∼U(0,1),则考虑如下随机变量列:
Y0(ω)Y1(ω)Y2(ω)Y3(ω)Y4(ω)Y5(ω)…=ω+1[0,1](ω)=ω+1[0,21](ω)=ω+1[21,1](ω)=ω+1[0,31](ω)=ω+1[31,32](ω)=ω+1[32,1](ω)
记Y(ω)=ω,则Yn(ω)依概率收敛至Y(ω),但是不以概率1收敛
中心极限定理连续性修正
由于常规的中心极限定理是:
σ/nX−μ→N(0,1)
因此一些离散分布使用该定理之后反而会失去其单点的概率(连续分布单点恒为0),因此进行连续性修正,以二项分布X∼B(n,p)为例:
P(t1≤X≤t2)≈Φ(y2)−Φ(y1)
其中:
Φ(yi)=np(1−p)ti−np+(21)i
极大似然估计可能有偏
均匀分布U(0,θ),样本值为{Xi}i=1n,则其MLE为θ∗=max{Xi},下面我们证明这个不是无偏估计:
Y=max{Xi}的CDF为:
FY(y)=P(max{Xi}≤y)=(FX(y))n=(θy)n
因此其PDF为f(y)=FY′(y)=θn(θy)n−1
因此我们有:
E(θ∗)=∫0θyf(y)dy=θnn∫0θyndy=n+1nθ
也即θ∗并不是θ的无偏估计
无偏MSE不一定优于有偏
X∼N(μ,σ2),分别用二阶矩m2和样本方差S2来估计σ2,有:
E(m2)E(S2)=nn−1σ2=σ2
但是:
E((m2−σ2)2)<E((S2−σ2)2)
区间估计
-
标准正态
如X∼N(μ,σ2),其中μ未知而σ2已知,则:
σ/nX−μ∼N(0,1)
因此(1−α)置信区间为:
(X−zα/2nσ,X+zα/2nσ)
其中z2α为标准正态分布上2α分位数
-
t分布
在上述例子中,如果σ2未知,则应利用t分布来进行区间估计,具体来说:
σ/nX−μσ2(n−1)S2∼N(0,1)∼χ2(n−1)
因此有:
S/nX−μ∼t(n−1)
(1−α)置信区间为:
(X−tα/2(n−1)nS,X+tα/2(1−α)nS)
同样估计均值差也可以使用t分布:X∼N(μ1,σ12),Y∼N(μ2,σ22),则μ1−μ2的估计方法为:
(n1+m1)n+m−2(n−1)S12+(m−1)S22(X−Y)−(μ1−μ2)∼t(n+m−2)
-
F分布
常用在估计两正态总体方差之比上,所依赖的分布为:
S22/σ22S12/σ12∼F(n−1,m−1)
-
渐进估计
利用中心极限定理得到标准正态分布利用S2或m2等方式来估计σ2
-
极大似然与Fisher
nI(θ∗)1θ∗−θ→N(0,1)
其中I(θ)为Fisher信息量,具体来说:
I(θ)=E((∂θ∂logf)2)