Skip to content

7 参数估计

概念

  • 参数:总体 X 的未知的数字特征,记为 θ,可以是一个数,也可以是一个向量(若干个数)
  • 参数空间:θ 的取值范围,记为 Θ
  • 参数估计
    • 点估计:构造统计量 θ^(X1,,Xn) 来估计 θ。称 θ^(X1,,Xn)θ 的估计量,θ^(x1,,xn)θ 的估计值。
    • 区间估计:构造两个统计量 θ(X1,,Xn)θ(X1,,Xn),用 [θ,θ] 来估计 θ 的范围

点估计

矩估计法

核心:用样本矩代替总体矩。

记总体 k 阶原点矩 μk=E(Xk),样本 k 阶原点矩 Ak=1ni=1nXik,若未知参数 θ=φ(μ1,,μm),称估计量 θ^=φ(A1,,Am) 为矩估计量。

定理(X1,,Xn) 为取自总体 X 的一个样本,E(X)=μVar(x)=σ2μσ 均未知。则:X¯ 是未知参数 μ 的矩估计,Sn2 是未知参数 σ2 的矩估计。

θ^θ 的矩估计量,则 g(θ^)g(θ) 的矩估计量。

TIP

思路:

  • 用样本矩代替总体矩,尽量选择阶数低的
  • 如果只有一个未知量,就令 E(X)=X¯
  • 如果有两个未知量,就再令 Var(X)=Sn2

例 1

  • 总体 XP(λ)λ>0λ 未知。则 λ^=X¯
  • 总体 XE(λ)λ>0λ 未知。则 λ^=1X¯
  • 总体 XU(0,θ)θ>0θ 未知。则 θ^=2X¯
  • 总体 XU(θ,θ)θ>0θ 未知。则
    • E(X)=0 无法用于估计
    • E(X2)=Var(x)+[E(X)]2=(2θ)212+02=θ23,则 θ=3E(X2),有 θ^=3A2=3ni=1nXi2

例 2

总体 XU(θ1,θ2)θ1<θ2θ1,θ2 均未知。


{E(X)=θ1+θ22Var(X)=(θ2θ1)212{θ1=E(X)3Var(X)θ2=E(X)+3Var(X){θ^1=X¯3Sn2θ^2=X¯+3Sn2

例 3

设总体 X 的密度函数为

f(x;θ)={1θ,0<x<θ212θ,θ2<x<10,

其中 0<θ<2θ 未知。(X1,,Xn) 是取自这个总体的样本,球 θ 的矩估计 θ^


E(X)=+xf(x)x=0θ/2xθx+θ/21x2θx=1+θ4θ=4E(X)1θ^=4X¯1

TIP

对于常见分布,直接按公式替换。

对于新分布,求期望(含未知参数 θ令期望等于均值,解方程得到 θ^

最大似然估计

(X1,,Xn) 为取自总体 X 的一个样本,总体 X 的密度函数为 f(x;θ),其中 θ 为未知参数,Θ 为参数空间,称

L(θ;x1,x2,,xn)=i=1nf(xi;θ),θΘ

为似然函数。若存在 θ^=θ^(x1,,xn),使得

L(θ^)=maxθΘL(θ)

则称 θ^(x1,,xn)θ 的最大似然估计值,称相应的 θ^(X1,,Xn)θ 的最大似然估计量。

求最大似然估计量的常用方法是通过取对数,将连乘转换为求和。即有最大似然方程:

θlnL(θ)=0

TIP

  1. 写出联合密度函数 L=f(xi;θ)
  2. 求对数 lnL=lnf(xi,θ)
  3. 令未知参数偏导为 0,求解 lnLθ=0,估得 θ^

例 4

用最大似然估计 μ 未知、σ 已知的正态分布总体抽样下 μ 的估计值。


L(μ)=i=1nf(x;μ)=i=1n12πσexp[(xiμ)22σ2]=(12πσ)nexp[(xiμ)22σ2]lnL(μ)=n2ln(2πσ2)(xiμ)22σ2lnL(μ)μ=2(xiμ)2σ2=0i=1n(xiμ)=(i=1nxi)nμ=0μ=1ni=1nxiμ^=1ni=1nXi=X¯

例 5

用最大似然估计 μ 已知、σ 未知的正态分布总体抽样下 σ2 的估计值。


L(σ2)=i=1nf(x;σ2)=i=1n12πσexp[(xiμ)22σ2]=(12πσ)nexp[(xiμ)22σ2]lnL(σ2)=n2ln(2π)n2lnσ2(xiμ)22σ2lnL(σ2)(σ2)=n21σ2+(xiμ)22σ4=0n21σ2=(xiμ)22σ4n=(xiμ)2σ2σ2=1ni=1n(xiμ)2σ^2=1ni=1n(XiX¯)2=Sn2

例 6

设总体 XU(0,θ)θ>0θ 未知。求 θ 的最大似然估计量 θ^


最大似然函数

L(θ)={i=1nf(x,θ)=(1θ)n=θn,0x1,,xnθ0,

考虑 0x1,,xnθ

θlnL(θ)=nθlnθ=nθ=0

无解。考虑回归定义:

L(θ^)=maxθΘL(θ)=maxθ>0θn

注意到 θ=max{x} 时有 maxL(θ),因此有 θ^=X(n)

TIP

上例说明

  • 不同估计手段得到的估计量不一定相同
  • 对数解不了的情况下考虑回归定义(连乘

推广,若有多维参数,寻找 θ^1,,θ^k 要求解似然方程组

{θ1lnL(θ1,,θk)=0θ2lnL(θ1,,θk)=0θklnL(θ1,,θk)=0

估计的优良性标准

  • 无偏性E(θ^)=θ,估计量的期望等于实际值(最重要

    • 渐近无偏:limnE(θ^)=θ,称为渐近(无偏)估计
  • 有效性:估计量的方差尽可能小

  • 相合性:样本量趋于无穷时,估计量趋于实际值(了解即可)

可以证明:样本均值 X¯、样本方差 Sn 是无偏估计量,但矩估计和最大似然估计给出的方差 Sn2 不是无偏估计量,只是渐近无偏估计

例 7

XU(0,θ) 时,

θ^=2X¯θ 的无偏估计:

E(2X¯)=2E(X)=θ

θ^=max1inXi 只是渐近无偏估计,因为

fx(n)(y)=n[F(y)]n1f(y)=n(yθ)n11θE(X(n))=0θynyn1θndy=nn+1θ

例 8

设总体均值为 μ,方差为 σ2,获得三个样本 x1,x2,x3

  1. 确定常数 a,b,使得 A=a(x1+x2+x3)B=b(x1+2x2+x3) 都是 μ 的无偏估计量
  2. 判断 AB 哪个更有效

1.

E(A)=aE(x1+x2+x3)=3aμ=μa=13E(B)=bE(x1+2x2+x3)=4bμ=μb=14

2.

Var(A)=a2Var(x1+x2+x3)=19(σ2+σ2+σ2)=13σ2Var(B)=b2Var(x1+2x2+x3)=116(σ2+4σ2+σ2)=38σ2Var(A)Var(B)

AB 更有效。

区间估计

给定置信度 1α,找一个区间 [L,R],使得 P(LθR)1α

默认取双尾,即 P(θ<L)=12αP(θ>R)=12α

TIP

  • 选择统计量 G
  • 找到区间使得 P(LGR)1α
  • 化简得到答案

如何选择估计量

估计问题统计量
σ 已知,估计 μZ=X¯μσ/nN(0,1)
σ 未知,估计 μT=X¯μS/nt(n1)
估计 σG=(n1)S2σ2χ2(n1)

σ 就用含 σ 的,没有就退而求其次用样本标准差 S。估计 σ 就只用 S

例 9

零件重量服从正态分布,取出 9 个零件质量如下,估计 μσ95% 置信区间。

45.345.445.145.345.545.745.445.345.6

已求出 X¯=45.4S2=0.0325,参考数据如下:

nt0.95(n)t0.975(n)χ0.0252(n)χ0.9752(n)
81.85952.30602.18017.535
91.83312.26222.70019.023

T=X¯μS/n=45.4μ0.0325/9t(8)

因此有 t0.025(8)Tt0.975(8),根据对称性即 t0.975(8)Tt0.975(8),代入得

2.306045.4μ0.0325/92.3060μ[45.2614,45.5368]

G=(n1)S2σ2=8×0.0325σ2χ2(8)χ0.0252(8)8×0.0325σ2χ0.9752(8)2.1808×0.0325σ217.535σ[0.1218,0.3454]