Skip to content
Ayas_Lan's Blog
Go back

极大似然估计,估计量的评价准则

Edit page

极大似然估计

似然函数定义: 设总体X具有概率质量函数p(x;θx;\theta),或概率密度函数f(x;θx;\theta),其中θ\theta未知。设X1,X2,...,XnX_{1}, X_{2}, ...,X_{n}为样本,其观测值为x1,x2,xnx_{1}, x_{2}, x_{n},则似然函数定义为:

L(θ)=i=1np(xi;θ)ori=1nf(xi;θ)L(\theta) = \prod_{i=1}^{n}p(x_{i};\theta)\quad or \quad \prod_{i=1}^{n}f(x_{i};\theta)

极大似然估计定义: 若{x1,x2,x3,...,xnx_{1}, x_{2}, x_{3},...,x_{n}}满足:

L{θ^(x1,...,xn)}=maxθL(θ)L\{\hat{\theta}(x_{1},...,x_{n})\} = max_{\theta} L(\theta)

则称θ(x1,...,xn)\theta(x_{1},...,x_{n})θ\theta的极大似然估计值,称对应的统计量θ^(X1,...,Xn)\hat{\theta}(X_{1},...,X_{n})称为θ\theta的极大似然估计量。 直观理解: 极大似然估计就是已知某种已经出现的结果,反推出出现这种结果概率最大的一种中参数方案。

对于极大似然估计的求解: 可令似然函数对于每一个参数θj\theta_{j}的偏导为0,得到方程组:

L(θ)θj=0,j=1,...,k\frac{\partial L(\theta)}{\partial \theta_{j}} = 0, \quad j = 1,...,k

联立求解可得极大似然估计。

note: 对于指数函数等形式,通常还会采取令l(θ)=log(L(θ))l(\theta) = log(L(\theta))的形式进行求导,解出max值的情况。

定理: θ^\hat{\theta}θ\theta的极大似然估计,则g(θ^)g(\hat{\theta})也是g(θ)g(\theta)的极大似然估计。

例题:

均匀分布:(样本的取值范围含有参数) 设总体X服从均匀分布U(a, b),其中a, b未知。设X1,X2,...,XnX_{1}, X_{2}, ..., X_{n}为样本,试求a,b的极大似然估计。进一步求E(x)的极大似然估计。 解: 均匀分布的密度函数为:

f(x)={1ba,a<=x<=b0,elsef(x) = \left\{\begin{matrix} \frac{1}{b-a}, \quad a <= x <= b\\ 0, \quad else \end{matrix}\right.

对应的似然函数为:

L(θ)={1(ba)n,a<=xi<=b0,elseL(\theta) = \left\{\begin{matrix} \frac{1}{(b-a)^{n}}, \quad a <= x_{i} <= b\\ 0, \quad else \end{matrix}\right.

这里对a,b存在范围上的约束:

a^=min{X1,X2,X3,...Xn}b^=max{X1,X2,....,Xn}\begin{aligned} \hat{a} = min\{X_{1}, X_{2}, X_{3},...X_{n}\}\\ \hat{b} = max\{X_{1}, X_{2},....,X_{n}\} \end{aligned}

故极大似然估计量为:a^=x(1)\hat{a} = x_{(1)}, b^=x(n)\hat{b} = x_{(n)},此时区间最小,即L(θ)L(\theta)最大。

估计量的评价准则

无偏性

偏差定义: 设参数θ\theta有估计量θ^=θ^(X1,X2,...,Xn)\hat{\theta} = \hat{\theta}(X_{1}, X_{2},...,X_{n}),则称E(θ^)θ|E(\hat{\theta}) - \theta|称为估计量θ\theta的偏差。

无偏性定义: 若参数θ\theta的估计量θ^\hat{\theta}满足:

E(θ^)=θE(\hat{\theta}) = \theta

则称θ^\hat{\theta}θ\theta的无偏估计量。 即:是在大量重复实验下,有θ^\hat{\theta}给出的估计的平均值为θ\theta,而单次给定的样本值中,θ^\hat{\theta}不一定等于θ\theta.

例题(均匀分布中最值期望的求解): 设总体X服从均匀分布U(0, θ\theta),θ\theta > 0是未知参数。样本分别为X1,X2,...,XnX_{1}, X_{2}, ...,X_{n}。试分别求θ\theta的矩估计和极大似然估计,并判断各自是否无偏。 解: 首先求矩估计: 由μ1\mu_{1} = E(X) = θ2\frac{\theta}{2},可得样本的θ^=2Xˉ\hat{\theta} = 2\bar{X}。可以得到:

E(θ^)=2E(Xˉ)=2E(X)=θE(\hat{\theta}) = 2E(\bar{X}) = 2E(X) = \theta

故矩估计无差。 然后求最大似然估计: U(0, θ\theta)的密度函数为:

f(x;θ)={1θ,0<=x<=θ0,elsef(x;\theta) = \left\{\begin{matrix} \frac{1}{\theta}, \quad 0 <= x <= \theta\\ 0, \quad else \end{matrix}\right.

得到对应的似然函数为:

L(θ)={1θn,0<=xi<=θ0,elseL(\theta) = \left\{\begin{matrix} \frac{1}{\theta^{n}}, \quad 0 <= x_{i} <= \theta\\ 0, \quad else \end{matrix}\right.

由于需要保证θmax{X1,X2,...,Xn}\theta \ge max\{X_{1}, X_{2}, ...,X_{n}\}。所以得到极大似然解为θ=Xn\theta = X_{n}. 对于E(θ^\hat{\theta})的计算,首先计算θ^\hat{\theta}的累积分布函数:

F(n)(x)=P(θ^<=x)=P(max{X1,X2,...,Xn}<=x)=P(X<=x)n=(xθ)n\begin{aligned} F_{(n)}(x) = P(\hat{\theta} <= x) &= P(max\{X_{1},X_{2},...,X_{n}\} <= x)\\ &= P(X <= x)^{n}\\ &= (\frac{x}{\theta})^{n} \end{aligned}

求导后得到对应的概率密度函数为:

f(n)(x)=F(n)(x)=nxn1θnf_{(n)}(x) = F_{(n)}'(x) = \frac{nx^{n-1}}{\theta^{n}}

于是:

E(θ^)=0θxnxn1θndx=0θnxnθndx=nn+1θ<θE(\hat{\theta}) = \int_{0}^{\theta}x* \frac{nx^{n-1}}{\theta^{n}}dx = \int_{0}^{\theta}\frac{nx^{n}}{\theta^{n}}dx = \frac{n}{n+1}\theta < \theta

故极大似然法求得的结果有偏差。

纠偏方法: 若E(θ^\hat{\theta}) = aθ+ba\theta + b,其中a, b是常数,则θ^ba\frac{\hat{\theta} - b}{a}为其对应的无偏估计。

有效性

有效性定义:θ^1,θ^2\hat{\theta}_{1}, \hat{\theta}_{2}为两个无偏估计,如果Var(θ^1)<Var(θ^2)Var(\hat{\theta}_{1}) < Var(\hat{\theta}_{2})对一切θ\theta均成立,则称θ1\theta_{1}θ2\theta_{2}有效。

均方误差

均方误差定义:θ^\hat{\theta}对于参数θ\theta的点估计,方差存在,则称E(θ^θ)2E(\hat{\theta} - \theta)^{2}是估计量θ^\hat{\theta}的均方误差,记作Mse(θ^\hat{\theta}) 设θ1^,θ2^\hat{\theta_{1}}, \hat{\theta_{2}}θ\theta的点估计,若Mse(θ1^)<Mse(θ2^)Mse(\hat{\theta_{1}}) < Mse(\hat{\theta_{2}})成立,则称在均方误差下,θ1^\hat{\theta_{1}}优于θ2^\hat{\theta_{2}}

均方误差分解式的推导:

Mse(θ^)=E(θ^θ)2=E(θ^E(θ^)+E(θ^)θ)2=E(θ^E(θ^))2+E(E(θ^)θ)2+2E[(θ^E(θ^))(E(θ^)θ)]=Var(θ^)+{E(θ^)θ}2\begin{aligned} Mse(\hat{\theta}) = E(\hat{\theta} - \theta)^{2} &= E(\hat{\theta} - E(\hat{\theta}) + E(\hat{\theta}) -\theta)^{2}\\ &=E(\hat{\theta} - E(\hat{\theta}))^{2} + E(E(\hat{\theta}) - \theta)^{2} + 2E[(\hat{\theta} - E(\hat{\theta}))(E(\hat{\theta}) - \theta)]\\ &= Var(\hat{\theta}) + \{E(\hat{\theta}) - \theta\}^{2} \end{aligned}

即均方误差 = θ^\hat{\theta}的方差 + θ^\hat{\theta}偏差的平方。

相合性定义:θ^\hat{\theta}θ\theta的估计量。若对于任意θ\theta,当nn \rightarrow \infty时,

θ^θ\hat{\theta} \rightarrow \theta

则称θn^\hat{\theta_{n}}θ\theta的相合估计量(一致估计量)


Edit page
Share this post on:

Previous Post
统计量,三个分布
Next Post
区间估计与置信区间