7 参数估计

概念

参数：总体 $X$ 的未知的数字特征，记为 $θ$ ，可以是一个数，也可以是一个向量（若干个数）
参数空间： $θ$ 的取值范围，记为 $Θ$
参数估计
- 点估计：构造统计量 $\hat{θ} (X_{1}, \dots, X_{n})$ 来估计 $θ$ 。称 $\hat{θ} (X_{1}, \dots, X_{n})$ 为 $θ$ 的估计量， $\hat{θ} (x_{1}, \dots, x_{n})$ 为 $θ$ 的估计值。
- 区间估计：构造两个统计量 $\underset{―}{θ} (X_{1}, \dots, X_{n})$ 和 $\overset{―}{θ} (X_{1}, \dots, X_{n})$ ，用 $[\underset{―}{θ}, \overset{―}{θ}]$ 来估计 $θ$ 的范围

点估计

矩估计法

核心：用样本矩代替总体矩。

记总体 $k$ 阶原点矩 $μ_{k} = E (X^{k})$ ，样本 $k$ 阶原点矩 $A_{k} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}^{k}$ ，若未知参数 $θ = φ (μ_{1}, \dots, μ_{m})$ ，称估计量 $\hat{θ} = φ (A_{1}, \dots, A_{m})$ 为矩估计量。

定理设 $(X_{1}, \dots, X_{n})$ 为取自总体 $X$ 的一个样本， $E (X) = μ$ ， $Var (x) = σ^{2}$ ， $μ$ 与 $σ$ 均未知。则： $\bar{X}$ 是未知参数 $μ$ 的矩估计， $S_{n}^{2}$ 是未知参数 $σ^{2}$ 的矩估计。

若 $\hat{θ}$ 是 $θ$ 的矩估计量，则 $g (\hat{θ})$ 为 $g (θ)$ 的矩估计量。

TIP

思路：

用样本矩代替总体矩，尽量选择阶数低的
如果只有一个未知量，就令 $E (X) = \bar{X}$
如果有两个未知量，就再令 $Var (X) = S_{n}^{2}$

例 1

总体 $X \sim P (λ)$ ， $λ > 0$ ， $λ$ 未知。则 ${\hat{λ}}_{矩} = \bar{X}$
总体 $X \sim E (λ)$ ， $λ > 0$ ， $λ$ 未知。则 ${\hat{λ}}_{矩} = \frac{1}{\bar{X}}$
总体 $X \sim U (0, θ)$ ， $θ > 0$ ， $θ$ 未知。则 ${\hat{θ}}_{矩} = 2 \bar{X}$
总体 $X \sim U (- θ, θ)$ ， $θ > 0$ ， $θ$ 未知。则
- $E (X) = 0$ 无法用于估计
- $E (X^{2}) = Var (x) + [E (X)]^{2} = \frac{(2 θ)^{2}}{12} + 0^{2} = \frac{θ^{2}}{3}$ ，则 $θ = \sqrt{3 E (X^{2})}$ ，有 ${\hat{θ}}_{矩} = \sqrt{3 A_{2}} = \sqrt{\frac{3}{n} \sum_{i = 1}^{n} X_{i}^{2}}$

例 2

总体 $X \sim U (θ_{1}, θ_{2})$ ， $θ_{1} < θ_{2}$ ， $θ_{1}, θ_{2}$ 均未知。

\begin{aligned} {\begin{cases} E (X) = \frac{θ_{1} + θ_{2}}{2} \\ Var (X) = \frac{(θ_{2} - θ_{1})^{2}}{12} \end{cases} & \Rightarrow {\begin{cases} θ_{1} = E (X) - \sqrt{3 Var (X)} \\ θ_{2} = E (X) + \sqrt{3 Var (X)} \end{cases} \\ \Rightarrow {\begin{cases} {\hat{θ}}_{1} = \bar{X} - \sqrt{3 S_{n}^{2}} \\ {\hat{θ}}_{2} = \bar{X} + \sqrt{3 S_{n}^{2}} \end{cases} \end{aligned}

例 3

设总体 $X$ 的密度函数为

f (x; θ) = {\begin{cases} \frac{1}{θ}, & 0 < x < \frac{θ}{2} \\ \frac{1}{2 - θ}, & \frac{θ}{2} < x < 1 \\ 0, & 其 他 \end{cases}

其中 $0 < θ < 2$ ， $θ$ 未知。 $(X_{1}, \dots, X_{n})$ 是取自这个总体的样本，球 $θ$ 的矩估计 $\hat{θ}$ ？

\begin{aligned} E (X) & = \int_{- \infty}^{+ \infty} x f (x) \partial x \\ = \int_{0}^{θ / 2} \frac{x}{θ} \partial x + \int_{θ / 2}^{1} \frac{x}{2 - θ} \partial x \\ = \frac{1 + θ}{4} \\ \Rightarrow θ & = 4 E (X) - 1 \\ \Rightarrow \hat{θ} & = 4 \bar{X} - 1 \end{aligned}

TIP

对于常见分布，直接按公式替换。

对于新分布，求期望（含未知参数 $θ$ ），令期望等于均值，解方程得到 $\hat{θ}$ 。

最大似然估计

设 $(X_{1}, \dots, X_{n})$ 为取自总体 $X$ 的一个样本，总体 $X$ 的密度函数为 $f (x; θ)$ ，其中 $θ$ 为未知参数， $Θ$ 为参数空间，称

L (θ; x_{1}, x_{2}, \dots, x_{n}) = \prod_{i = 1}^{n} f (x_{i}; θ), θ \in Θ

为似然函数。若存在 $\hat{θ} = \hat{θ} (x_{1}, \dots, x_{n})$ ，使得

L (\hat{θ}) = max_{θ \in Θ} L (θ)

则称 $\hat{θ} (x_{1}, \dots, x_{n})$ 为 $θ$ 的最大似然估计值，称相应的 $\hat{θ} (X_{1}, \dots, X_{n})$ 为 $θ$ 的最大似然估计量。

求最大似然估计量的常用方法是通过取对数，将连乘转换为求和。即有最大似然方程：

\frac{\partial}{\partial θ} \ln L (θ) = 0

TIP

写出联合密度函数 $L = \prod f (x_{i}; θ)$
求对数 $\ln L = \sum \ln f (x_{i}, θ)$
令未知参数偏导为 $0$ ，求解 $\frac{\partial \ln L}{\partial θ} = 0$ ，估得 $\hat{θ}$

例 4

用最大似然估计 $μ$ 未知、 $σ$ 已知的正态分布总体抽样下 $μ$ 的估计值。

\begin{matrix} \begin{aligned} L (μ) & = \prod_{i = 1}^{n} f (x; μ) \\ = \prod_{i = 1}^{n} \frac{1}{\sqrt{2 π} σ} \exp [- \frac{(x_{i} - μ)^{2}}{2 σ^{2}}] \\ = {(\frac{1}{\sqrt{2 π} σ})}^{n} \exp [- \frac{\sum (x_{i} - μ)^{2}}{2 σ^{2}}] \\ \ln L (μ) & = - \frac{n}{2} \ln (2 π σ^{2}) - \frac{\sum (x_{i} - μ)^{2}}{2 σ^{2}} \\ \frac{\partial \ln L (μ)}{\partial μ} & = \frac{2 \sum (x_{i} - μ)}{2 σ^{2}} = 0 \end{aligned} \\ \Rightarrow \sum_{i = 1}^{n} (x_{i} - μ) = (\sum_{i = 1}^{n} x_{i}) - n μ = 0 \\ \Rightarrow μ = \frac{1}{n} \sum_{i = 1}^{n} x_{i} \Rightarrow {\hat{μ}}_{最} = \frac{1}{n} \sum_{i = 1}^{n} X_{i} = \bar{X} \end{matrix}

例 5

用最大似然估计 $μ$ 已知、 $σ$ 未知的正态分布总体抽样下 $σ^{2}$ 的估计值。

\begin{matrix} \begin{aligned} L (σ^{2}) & = \prod_{i = 1}^{n} f (x; σ^{2}) \\ = \prod_{i = 1}^{n} \frac{1}{\sqrt{2 π} σ} \exp [- \frac{(x_{i} - μ)^{2}}{2 σ^{2}}] \\ = {(\frac{1}{\sqrt{2 π} σ})}^{n} \exp [- \frac{\sum (x_{i} - μ)^{2}}{2 σ^{2}}] \\ \ln L (σ^{2}) & = - \frac{n}{2} \ln (2 π) - \frac{n}{2} \ln σ^{2} - \frac{\sum (x_{i} - μ)^{2}}{2 σ^{2}} \\ \frac{\partial \ln L (σ^{2})}{\partial (σ^{2})} & = - \frac{n}{2} \cdot \frac{1}{σ^{2}} + \frac{\sum (x_{i} - μ)^{2}}{2 σ^{4}} = 0 \end{aligned} \\ \Rightarrow \frac{n}{2} \cdot \frac{1}{σ^{2}} = \frac{\sum (x_{i} - μ)^{2}}{2 σ^{4}} \Rightarrow n = \frac{\sum (x_{i} - μ)^{2}}{σ^{2}} \\ \Rightarrow σ^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ)^{2} \\ \Rightarrow {\hat{σ}}_{最}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \bar{X})^{2} = S_{n}^{2} \end{matrix}

例 6

设总体 $X \sim U (0, θ)$ ， $θ > 0$ ， $θ$ 未知。求 $θ$ 的最大似然估计量 $\hat{θ}$ 。

最大似然函数

L (θ) = {\begin{cases} \prod_{i = 1}^{n} f (x, θ) = {(\frac{1}{θ})}^{n} = θ^{- n}, & 0 \leq x_{1}, \dots, x_{n} \leq θ \\ 0, & 其 他 \end{cases}

考虑 $0 \leq x_{1}, \dots, x_{n} \leq θ$ 时

\begin{array}{r} \frac{\partial}{\partial θ} \ln L (θ) = - n \frac{\partial}{\partial θ} \ln θ = - \frac{n}{θ} = 0 \end{array}

无解。考虑回归定义：

L (\hat{θ}) = max_{θ \in Θ} L (θ) = max_{θ > 0} θ^{- n}

注意到 $θ = max {x}$ 时有 $max L (θ)$ ，因此有 $\hat{θ} = X_{(n)}$

TIP

上例说明

不同估计手段得到的估计量不一定相同
对数解不了的情况下考虑回归定义（连乘）。

推广，若有多维参数，寻找 ${\hat{θ}}_{1}, \dots, {\hat{θ}}_{k}$ 要求解似然方程组

{\begin{aligned} \frac{\partial}{\partial θ_{1}} \ln L (θ_{1}, \dots, θ_{k}) = 0 \\ \frac{\partial}{\partial θ_{2}} \ln L (θ_{1}, \dots, θ_{k}) = 0 \\ \dots \dots \\ \frac{\partial}{\partial θ_{k}} \ln L (θ_{1}, \dots, θ_{k}) = 0 \end{aligned}

估计的优良性标准

无偏性： $E (\hat{θ}) = θ$ ，估计量的期望等于实际值（最重要）
- 渐近无偏： $lim_{n \to \infty} E (\hat{θ}) = θ$ ，称为渐近（无偏）估计
有效性：估计量的方差尽可能小
相合性：样本量趋于无穷时，估计量趋于实际值（了解即可）

可以证明：样本均值 $\bar{X}$ 、样本方差 $S_{n}$ 是无偏估计量，但矩估计和最大似然估计给出的方差 $S_{n}^{2}$ 不是无偏估计量，只是渐近无偏估计。

例 7

$X \sim U (0, θ)$ 时，

${\hat{θ}}_{矩} = 2 \bar{X}$ 是 $θ$ 的无偏估计：

E (2 \bar{X}) = 2 E (X) = θ

而 ${\hat{θ}}_{最} = max_{1 \leq i \leq n} X_{i}$ 只是渐近无偏估计，因为

\begin{matrix} f_{x_{(n)}} (y) = n [F (y)]^{n - 1} f (y) = n \cdot {(\frac{y}{θ})}^{n - 1} \cdot \frac{1}{θ} \\ E (X_{(n)}) = \int_{0}^{θ} y \frac{n y^{n - 1}}{θ^{n}} d y = \frac{n}{n + 1} θ \end{matrix}

例 8

设总体均值为 $μ$ ，方差为 $σ^{2}$ ，获得三个样本 $x_{1}, x_{2}, x_{3}$

确定常数 $a, b$ ，使得 $A = a (x_{1} + x_{2} + x_{3})$ 和 $B = b (x_{1} + 2 x_{2} + x_{3})$ 都是 $μ$ 的无偏估计量
判断 $A$ 和 $B$ 哪个更有效

\begin{matrix} E (A) = a E (x_{1} + x_{2} + x_{3}) = 3 a μ = μ \Rightarrow a = \frac{1}{3} \\ E (B) = b E (x_{1} + 2 x_{2} + x_{3}) = 4 b μ = μ \Rightarrow b = \frac{1}{4} \end{matrix}

\begin{matrix} Var (A) = a^{2} Var (x_{1} + x_{2} + x_{3}) = \frac{1}{9} (σ^{2} + σ^{2} + σ^{2}) = \frac{1}{3} σ^{2} \\ Var (B) = b^{2} Var (x_{1} + 2 x_{2} + x_{3}) = \frac{1}{16} (σ^{2} + 4 σ^{2} + σ^{2}) = \frac{3}{8} σ^{2} \\ Var (A) \leq Var (B) \end{matrix}

$A$ 比 $B$ 更有效。

区间估计

给定置信度 $1 - α$ ，找一个区间 $[L, R]$ ，使得 $P (L \leq θ \leq R) \geq 1 - α$ 。

默认取双尾，即 $P (θ < L) = \frac{1}{2} α$ ， $P (θ > R) = \frac{1}{2} α$

TIP

选择统计量 $G$
找到区间使得 $P (L \leq G \leq R) \geq 1 - α$
化简得到答案

如何选择估计量

估计问题	统计量
$σ$ 已知，估计 $μ$	$Z = \frac{\bar{X} - μ}{σ / \sqrt{n}} \sim N (0, 1)$
$σ$ 未知，估计 $μ$	$T = \frac{\bar{X} - μ}{S / \sqrt{n}} \sim t (n - 1)$
估计 $σ$	$G = \frac{(n - 1) S^{2}}{σ^{2}} \sim χ^{2} (n - 1)$

有 $σ$ 就用含 $σ$ 的，没有就退而求其次用样本标准差 $S$ 。估计 $σ$ 就只用 $S$ 。

例 9

零件重量服从正态分布，取出 9 个零件质量如下，估计 $μ$ 和 $σ$ 的 $95 %$ 置信区间。

\begin{matrix} 45.3 & 45.4 & 45.1 & 45.3 & 45.5 & 45.7 & 45.4 & 45.3 & 45.6 \end{matrix}

已求出 $\bar{X} = 45.4$ ， $S^{2} = 0.0325$ ，参考数据如下：

$n$	$t_{0.95} (n)$	$t_{0.975} (n)$	$χ_{0.025}^{2} (n)$	$χ_{0.975}^{2} (n)$
$8$	$1.8595$	$2.3060$	$2.180$	$17.535$
$9$	$1.8331$	$2.2622$	$2.700$	$19.023$

令

T = \frac{\bar{X} - μ}{S / \sqrt{n}} = \frac{45.4 - μ}{\sqrt{0.0325 / 9}} \sim t (8)

因此有 $t_{0.025} (8) \leq T \leq t_{0.975} (8)$ ，根据对称性即 $- t_{0.975} (8) \leq T \leq t_{0.975} (8)$ ，代入得

\begin{matrix} - 2.3060 \leq \frac{45.4 - μ}{\sqrt{0.0325 / 9}} \leq 2.3060 \\ \Rightarrow μ \in [45.2614, 45.5368] \end{matrix}

令

\begin{matrix} G = \frac{(n - 1) S^{2}}{σ^{2}} = \frac{8 \times 0.0325}{σ^{2}} \sim χ^{2} (8) \\ χ_{0.025}^{2} (8) \leq \frac{8 \times 0.0325}{σ^{2}} \leq χ_{0.975}^{2} (8) \\ 2.180 \leq \frac{8 \times 0.0325}{σ^{2}} \leq 17.535 \\ \Rightarrow σ \in [0.1218, 0.3454] \end{matrix}

7 参数估计 ​

概念 ​

点估计 ​

矩估计法 ​

最大似然估计 ​

估计的优良性标准 ​

区间估计 ​

7 参数估计

概念

点估计

矩估计法

最大似然估计

估计的优良性标准

区间估计