Skip to content
Ayas_Lan's Blog
Go back

区间估计与置信区间

Edit page

置信区间

置信区间的定义

CI的定义: 设总体X的分布函数为F(x; θ\theta),其中θ\theta未知。对给定的0<α<10 < \alpha <1,如果统计量L = L(X1,...,XnX_{1},...,X_{n})与U=U(X1,...,Xn)U = U(X_{1},...,X_{n})满足:

P{L(X1,X2,...Xn)<θ<U(X1,X2,...Xn)}=1αP\{L(X_{1},X_{2},...X_{n}) < \theta < U(X_{1},X_{2},...X_{n})\} = 1-\alpha

则称(L, U)为θ\theta的置信水平为(1α)(1 - \alpha)的置信区间

NOTE:

单侧置信上/下限: 若统计量L = L(X1,X2,....,Xn)L(X_{1},X_{2},....,X_{n})满足:

P{L(X1,X2,...,Xn)<θ}=1αP\{L(X_{1}, X_{2},...,X_{n}) <\theta\} = 1-\alpha

则称L为θ\theta的置信水平为(1α1 - \alpha)的单侧置信上限 NOTE: 也可以看做落在区间(,L-\infty, L)上。

精确度: 置信区间(L, U)的平均长度E(U - L)可表示区间的精确度:E(U - L)越小,区间的精确度越高。

枢轴量法

如何得到未知参数θ\theta满足给定置信度1α1 - \alpha的置信区间? 枢轴量法:

枢轴量定义: 设总体X有概率密度函数f(x;θ\theta),其中θ\theta为待估的未知参数。设X1,X2,...,XnX_{1},X_{2},...,X_{n}为样本,则随机变量:

G=G(X1,X2,...,Xn;θ)G = G(X_{1},X_{2},...,X_{n};\theta)

的分布已知,则称G为枢轴量。

下面以几个例子进行置信区间的求解:

G=XˉμS/nt(n1)G = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

故目标为确定a,b使得:

P(a<XˉμS/n<b)=1αP\left(a <\frac{\bar{X} - \mu}{S / \sqrt{n}} < b\right)= 1- \alpha

由此得到μ\mu的置信区间为:

(XˉbSn,XˉaSn)(\bar{X} - b\frac{S}{\sqrt{n}}, \bar{X} - a\frac{S}{\sqrt{n}})

此时的区间长度为:(ba)Sn(b-a)\frac{S}{\sqrt{n}},需要使得区间长度最小。推导可得对于正态这种对称的分布,b = a时区间长度最小。 故当b = -a = tα/2(n1)t_{\alpha/2}(n-1)时,置信区间为:

(Xˉtα/2(n1)Sn,Xˉ+tα/2(n1)Sn)(\bar{X} - t_{\alpha / 2}(n-1) \frac{S}{\sqrt{n}}, \bar{X} + t_{\alpha / 2}(n-1) \frac{S}{\sqrt{n}}) (T1α(n,1)nXˉ,Tα(n,1)nXˉ)(\frac{T_{1-\alpha}(n,1)}{n\bar{X}}, \frac{T_{\alpha}(n, 1)}{n\bar{X}})

正态总体的区间估计

单个正态总体的均值

设总体X N(μ,σ2)\sim N(\mu, \sigma^{2}),样本为X1,X2,...,XnX_{1},X_{2},...,X_{n}。用XˉS2\bar{X}和S^{2}来表示样本均值和样本方差。取置信水平为1 - α\alpha,求μ\mu的置信区间。 case1:σ2=σ02\sigma^{2} = \sigma_{0}^{2}已知: 此时可以选取枢轴量为:

G=Xˉμσ0/nG = \frac{\bar{X} - \mu}{\sigma_{0}/\sqrt{n}}

由于N(0, 1)关于0对称,故区间最短的a,b满足b = -a = zα/2z_{\alpha / 2}.所以得到置信区间为:

(Xˉzα2σ0n,Xˉ+zα/2σ0n)(\bar{X} - z_{\frac{\alpha}{2}}\frac{\sigma_{0}}{\sqrt{n}},\bar{X} + z_{\alpha / 2}\frac{\sigma_{0}}{\sqrt{n}})

case2:σ2\sigma^{2}未知 此时可以使用S2S^{2}代替σ2\sigma^{2},得到枢轴量:

G=XˉμS/nt(n1)G = \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n-1)

同理可以得到双侧置信区间对称

单个正态总体的方差

设总体XN(μ,σ2)X \sim N(\mu, \sigma^{2}),其中μ,σ\mu, \sigma未知,样本为X1,X2,...,XnX_{1}, X_{2}, ...,X_{n}。用XˉS2\bar{X}和S^{2}分别表示样本均值和样本方差。取置信水平1α1 - \alpha,求σ2\sigma^{2}的置信区间。 解: 由于S2S^{2}σ2\sigma^{2}的一个无偏估计。根据学生定理,选取枢纽量:

G=(n1)S2σ2x2(n1)G = \frac{(n-1)S^{2}}{\sigma^{2}} \sim x^{2}(n-1)

由于x2(n1)x^{2}(n-1)不是对称分布的,可以选择a,b使得: P(G <= a) = α/2\alpha / 2, P(G >= b) = α/2\alpha / 2 故可以使得a为x2(n1)x^{2}(n-1)分布的上(1 - α/2\alpha / 2)分位数,b为x2(n1)x^{2}(n-1)分布的上α/2\alpha / 2分位数。 故得到置信区间为:

((n1)S2xα2(n1)2,((n1)S2x1α2(n1)2)(\frac{(n-1)S^{2}}{x^{2}_{\frac{\alpha}{2}(n-1)}},(\frac{(n-1)S^{2}}{x^{2}_{1-\frac{\alpha}{2}(n-1)}} )

两个正态总体

设样本X1,...,Xn1X_{1},...,X_{n_{1}}Y1,...,Yn2Y_{1},...,Y_{n_{2}},分别来自总体XN(μ1,σ12)X \sim N(\mu_{1}, \sigma_{1}^{2})YN(μ2,σ22)Y \sim N(\mu_{2}, \sigma_{2}^{2}),且他们相互独立。样本均值为Xˉ\bar{X}Yˉ\bar{Y},样本方差为S12S_{1}^{2}S22S_{2}^{2}。置信水平为1α1 - \alphaQ1:若μ1μ2\mu_{1} - \mu_{2}的置信区间,假设σ12σ22\sigma_{1}^{2},\sigma_{2}^{2}已知: 由题可知,μ1μ2\mu_{1} - \mu_{2}的一个估计量为XˉYˉ\bar{X} - \bar{Y},故将其标准化后得到枢轴量:

(XˉYˉ)(μ1μ2)σ12n1+σ2n2N(0,1)\frac{(\bar{X} - \bar{Y}) - (\mu_{1} - \mu_{2})}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}}} \sim N(0, 1)

Q2:求μ1μ2\mu_{1} - \mu_{2}的置信区间,其中σ1=σ2=σ\sigma_{1} = \sigma_{2} = \sigma未知 采用学生定理得到枢轴量为:

(XˉYˉ)(μ1μ2)Sw1/n1+1/n2t(n1+n22)\frac{(\bar{X} - \bar{Y}) - (\mu_{1} - \mu_{2})}{S_{w}\sqrt{1 / n_{1} + 1 / n_{2}}} \sim t(n_{1} + n_{2} - 2)

Q3:求σ12/σ22\sigma_{1}^{2} / \sigma_{2}^{2}的置信区间,假设μ1,μ2\mu_{1},\mu_{2}未知 由题可知S12/S22S_{1}^{2} / S_{2}^{2}是其的一个估计量,且有:

S12σ12S22σ22F(n11,n21)\frac{\frac{S_{1}^{2}}{\sigma_{1}^{2}}}{\frac{S_{2}^{2}}{\sigma_{2}^{2}}} \sim F(n_{1} - 1, n_{2} - 1)

故将其作为枢轴量即可。


Edit page
Share this post on:

Previous Post
极大似然估计,估计量的评价准则
Next Post
假设检验