13 统计假设检验

基本思想

参数估计是由有限样本推断总体参数；假设检验是根据样本信息判断总体是否具有某种指定特征。

假设检验的依据是：小概率事件在一次试验中通常不会发生。

常见应用：

检验观测中是否存在系统误差
比较两组观测精度是否有显著差异
判断标称精度是否与观测数据相符
检验平差后验方差与先验方差是否一致

检验步骤

根据问题建立原假设 $H_{0}$ 和备择假设 $H_{1}$
选显著性水平 $α$
选检验统计量，并在 $H_{0}$ 成立时确定其分布
由 $α$ 查分位值，确定接受域和拒绝域
将样本统计量代入判断：落入拒绝域则拒绝 $H_{0}$ ，否则接受 $H_{0}$

两类错误：

错误	含义	概率
第一类错误	$H_{0}$ 实际成立，却拒绝 $H_{0}$ ，即弃真	$α$
第二类错误	$H_{0}$ 实际不成立，却接受 $H_{0}$ ，即纳伪	$β$

在样本容量一定时， $α$ 和 $β$ 通常不能同时减小。

常用参数检验

下面用 $q_{p} (\cdot)$ 表示累计概率为 $p$ 的分位值。双侧检验接受域通常取中间 $1 - α$ 的概率区间。

u 检验

用于方差已知时的正态总体均值检验。

单个总体：

H_{0} : μ = μ_{0}, u = \frac{\bar{x} - μ_{0}}{σ / \sqrt{n}} \sim N (0, 1)

双侧检验接受域：

| u | \leq u_{α / 2}

这里 $u_{α / 2}$ 通常指标准正态分布的双侧临界值，如 $α = 0.05$ 时 $u_{α / 2} = 1.96$ 。

两个总体，方差已知：

H_{0} : μ_{1} - μ_{2} = Δ_{0}

u = \frac{(\bar{x} - \bar{y}) - Δ_{0}}{\sqrt{\frac{σ_{1}^{2}}{n_{1}} + \frac{σ_{2}^{2}}{n_{2}}}} \sim N (0, 1)

常用于已知仪器标称精度时，检验平均误差或闭合差均值是否显著偏离理论值。

t 检验

用于方差未知时的正态总体均值检验。

单个总体：

H_{0} : μ = μ_{0}, t = \frac{\bar{x} - μ_{0}}{s / \sqrt{n}} \sim t (n - 1)

其中

s^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}

双侧检验接受域：

| t | \leq t_{α / 2} (n - 1)

两个总体，方差未知但可认为相等：

H_{0} : μ_{1} - μ_{2} = Δ_{0}

t = \frac{(\bar{x} - \bar{y}) - Δ_{0}}{s_{p} \sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}} \sim t (n_{1} + n_{2} - 2)

s_{p}^{2} = \frac{(n_{1} - 1) s_{1}^{2} + (n_{2} - 1) s_{2}^{2}}{n_{1} + n_{2} - 2}

常用于仪器精度未知时，检验一组观测是否存在显著系统误差。

$χ^{2}$ 检验

用于单个正态总体方差检验。

H_{0} : σ^{2} = σ_{0}^{2}

χ^{2} = \frac{(n - 1) s^{2}}{σ_{0}^{2}} \sim χ^{2} (n - 1)

双侧检验接受域：

q_{α / 2} (χ_{n - 1}^{2}) \leq χ^{2} \leq q_{1 - α / 2} (χ_{n - 1}^{2})

常用于检验观测精度是否与标称精度一致。

F 检验

用于两个正态总体方差检验。

H_{0} : σ_{1}^{2} = σ_{2}^{2}

F = \frac{s_{1}^{2}}{s_{2}^{2}} \sim F (n_{1} - 1, n_{2} - 1)

双侧检验接受域：

q_{α / 2} (F_{n_{1} - 1, n_{2} - 1}) \leq F \leq q_{1 - α / 2} (F_{n_{1} - 1, n_{2} - 1})

实际计算时也常把较大的样本方差放在分子，使 $F \geq 1$ ，再按右侧临界值判断。

常用于比较两期观测、两台仪器或两种方案的精度是否有显著差异。

检验方法选择

检验目的	方差情况	检验方法
单个总体均值	方差已知	$u$ 检验
单个总体均值	方差未知	$t$ 检验
两个总体均值	方差已知	$u$ 检验
两个总体均值	方差未知且可认为相等	$t$ 检验
单个总体方差	与标称方差比较	$χ^{2}$ 检验
两个总体方差	比较两组精度	$F$ 检验

检验系统误差：多看均值，用 $u$ 或 $t$
检验精度：多看方差，用 $χ^{2}$ 或 $F$

偶然误差特性的检验

偶然误差应满足有界性、趋向性、对称性、抵偿性。若误差列明显违背这些性质，可能存在系统误差、粗差或模型问题。

设误差列为

Δ_{1}, Δ_{2}, \dots, Δ_{n}

正负误差个数检验

偶然误差正负号应大致相等。

令正误差个数为 $k$ 。在 $H_{0}$ 成立时，

k \sim B (n, \frac{1}{2})

当 $n$ 较大时，可用正态近似：

u = \frac{k - \frac{n}{2}}{\sqrt{n / 4}} \sim N (0, 1)

双侧检验：

| u | \leq u_{α / 2}

若不满足，说明误差符号偏向某一侧，可能存在系统误差。

正负误差顺序检验

正负个数相近不代表误差没有系统趋势。若前一段多为正、后一段多为负，也可能有系统误差。

令相邻误差同号的对数为 $s$ 。共有 $n - 1$ 对相邻误差，在 $H_{0}$ 成立时近似有

E (s) = \frac{n - 1}{2}, D (s) = \frac{n - 1}{4}

检验统计量为

u = \frac{s - \frac{n - 1}{2}}{\sqrt{(n - 1) / 4}} \sim N (0, 1)

双侧检验：

| u | \leq u_{α / 2}

若同号对数过多，说明误差有连续偏向；若同号对数过少，说明正负交替异常。

误差数值总和检验

偶然误差应具有抵偿性，误差和应接近 $0$ 。

若已知中误差 $σ$ ：

u = \frac{\sum_{i = 1}^{n} Δ_{i}}{σ \sqrt{n}} \sim N (0, 1)

若 $σ$ 未知，可用误差列估计中误差 $m$ 代替：

u \approx \frac{\sum_{i = 1}^{n} Δ_{i}}{m \sqrt{n}}

双侧检验：

| u | \leq u_{α / 2}

若不满足，说明误差总和偏离零较明显，可能存在系统误差。

单个误差超限检验

偶然误差具有有界性。通常用极限误差判断单个误差是否异常：

| Δ_{i} | \leq k m

常用 $k = 3$ ，即

| Δ_{i} | \leq 3 m

若某个误差超过限值，应优先检查粗差、记录错误或观测条件异常。

后验方差检验

测量平差依赖函数模型和随机模型。若模型正确，则先验单位权方差 $σ_{0}^{2}$ 与后验单位权方差估值

{\hat{σ}}_{0}^{2} = \frac{V^{T} P V}{r}

应统计一致。

建立假设

H_{0} : σ^{2} = σ_{0}^{2}

检验统计量为

χ^{2} = \frac{r {\hat{σ}}_{0}^{2}}{σ_{0}^{2}} = \frac{V^{T} P V}{σ_{0}^{2}} \sim χ^{2} (r)

接受域为

q_{α / 2} (χ_{r}^{2}) \leq \frac{V^{T} P V}{σ_{0}^{2}} \leq q_{1 - α / 2} (χ_{r}^{2})

若拒绝 $H_{0}$ ，说明后验方差与先验方差不一致，可能原因包括：

函数模型有偏差
起算数据不正确
观测值含系统误差或粗差
定权不正确
参数近似值太差，线性化误差明显

参数区间估计

区间估计给出参数真值可能出现的范围，以及该范围包含真值的可信程度。

总体均值的置信区间

方差已知：

μ \in [\bar{x} - u_{α / 2} \frac{σ}{\sqrt{n}}, \bar{x} + u_{α / 2} \frac{σ}{\sqrt{n}}]

方差未知：

μ \in [\bar{x} - t_{α / 2} (n - 1) \frac{s}{\sqrt{n}}, \bar{x} + t_{α / 2} (n - 1) \frac{s}{\sqrt{n}}]

置信度为 $1 - α$ 。

总体方差的置信区间

对正态总体，有

\frac{(n - 1) s^{2}}{σ^{2}} \sim χ^{2} (n - 1)

因此总体方差的 $1 - α$ 置信区间为

σ^{2} \in [\frac{(n - 1) s^{2}}{q_{1 - α / 2} (χ_{n - 1}^{2})}, \frac{(n - 1) s^{2}}{q_{α / 2} (χ_{n - 1}^{2})}]

解题模板

写假设
- $H_{0}$ ：无显著差异或无系统误差
- $H_{1}$ ：有显著差异或有系统误差
判断检验对象
- 均值问题： $u$ 或 $t$
- 方差问题： $χ^{2}$ 或 $F$
- 后验方差问题： $χ^{2} (r)$
写统计量和分布
例：
$t = \frac{\bar{x} - μ_{0}}{s / \sqrt{n}} \sim t (n - 1)$
查临界值，写接受域
例如双侧：
$| t | \leq t_{α / 2} (n - 1)$
代入样本值判断，解释结论
- 接受 $H_{0}$ ：没有显著系统误差、精度无显著差异、标称精度基本一致
- 拒绝 $H_{0}$ ：存在显著系统误差、精度有显著差异、随机模型或函数模型可能有问题

13 统计假设检验 ​

基本思想 ​

检验步骤 ​

常用参数检验 ​

u 检验 ​

t 检验 ​

χ2 检验 ​

F 检验 ​

检验方法选择 ​

偶然误差特性的检验 ​

正负误差个数检验 ​

正负误差顺序检验 ​

误差数值总和检验 ​

单个误差超限检验 ​

后验方差检验 ​

参数区间估计 ​

总体均值的置信区间 ​

总体方差的置信区间 ​

解题模板 ​

13 统计假设检验

基本思想

检验步骤

常用参数检验

u 检验

t 检验

$χ^{2}$ 检验

F 检验

检验方法选择

偶然误差特性的检验

正负误差个数检验

正负误差顺序检验

误差数值总和检验

单个误差超限检验

后验方差检验

参数区间估计

总体均值的置信区间

总体方差的置信区间

解题模板