Skip to content

13 统计假设检验

基本思想

参数估计是由有限样本推断总体参数;假设检验是根据样本信息判断总体是否具有某种指定特征。

假设检验的依据是:小概率事件在一次试验中通常不会发生。

常见应用:

  • 检验观测中是否存在系统误差
  • 比较两组观测精度是否有显著差异
  • 判断标称精度是否与观测数据相符
  • 检验平差后验方差与先验方差是否一致

检验步骤

  1. 根据问题建立原假设 H0 和备择假设 H1
  2. 选显著性水平 α
  3. 选检验统计量,并在 H0 成立时确定其分布
  4. α 查分位值,确定接受域和拒绝域
  5. 将样本统计量代入判断:落入拒绝域则拒绝 H0,否则接受 H0

两类错误:

错误含义概率
第一类错误H0 实际成立,却拒绝 H0,即弃真α
第二类错误H0 实际不成立,却接受 H0,即纳伪β

在样本容量一定时,αβ 通常不能同时减小。

常用参数检验

下面用 qp() 表示累计概率为 p 的分位值。双侧检验接受域通常取中间 1α 的概率区间。

u 检验

用于方差已知时的正态总体均值检验。

单个总体:

H0:μ=μ0,u=x¯μ0σ/nN(0,1)

双侧检验接受域:

|u|uα/2

这里 uα/2 通常指标准正态分布的双侧临界值,如 α=0.05uα/2=1.96

两个总体,方差已知:

H0:μ1μ2=Δ0u=(x¯y¯)Δ0σ12n1+σ22n2N(0,1)

常用于已知仪器标称精度时,检验平均误差或闭合差均值是否显著偏离理论值。

t 检验

用于方差未知时的正态总体均值检验。

单个总体:

H0:μ=μ0,t=x¯μ0s/nt(n1)

其中

s2=1n1i=1n(xix¯)2

双侧检验接受域:

|t|tα/2(n1)

两个总体,方差未知但可认为相等:

H0:μ1μ2=Δ0t=(x¯y¯)Δ0sp1n1+1n2t(n1+n22)sp2=(n11)s12+(n21)s22n1+n22

常用于仪器精度未知时,检验一组观测是否存在显著系统误差。

χ2 检验

用于单个正态总体方差检验。

H0:σ2=σ02χ2=(n1)s2σ02χ2(n1)

双侧检验接受域:

qα/2(χn12)χ2q1α/2(χn12)

常用于检验观测精度是否与标称精度一致。

F 检验

用于两个正态总体方差检验。

H0:σ12=σ22F=s12s22F(n11,n21)

双侧检验接受域:

qα/2(Fn11,n21)Fq1α/2(Fn11,n21)

实际计算时也常把较大的样本方差放在分子,使 F1,再按右侧临界值判断。

常用于比较两期观测、两台仪器或两种方案的精度是否有显著差异。

检验方法选择

检验目的方差情况检验方法
单个总体均值方差已知u 检验
单个总体均值方差未知t 检验
两个总体均值方差已知u 检验
两个总体均值方差未知且可认为相等t 检验
单个总体方差与标称方差比较χ2 检验
两个总体方差比较两组精度F 检验
  • 检验系统误差:多看均值,用 ut
  • 检验精度:多看方差,用 χ2F

偶然误差特性的检验

偶然误差应满足有界性、趋向性、对称性、抵偿性。若误差列明显违背这些性质,可能存在系统误差、粗差或模型问题。

设误差列为

Δ1,Δ2,,Δn

正负误差个数检验

偶然误差正负号应大致相等。

令正误差个数为 k。在 H0 成立时,

kB(n,12)

n 较大时,可用正态近似:

u=kn2n/4N(0,1)

双侧检验:

|u|uα/2

若不满足,说明误差符号偏向某一侧,可能存在系统误差。

正负误差顺序检验

正负个数相近不代表误差没有系统趋势。若前一段多为正、后一段多为负,也可能有系统误差。

令相邻误差同号的对数为 s。共有 n1 对相邻误差,在 H0 成立时近似有

E(s)=n12,D(s)=n14

检验统计量为

u=sn12(n1)/4N(0,1)

双侧检验:

|u|uα/2

若同号对数过多,说明误差有连续偏向;若同号对数过少,说明正负交替异常。

误差数值总和检验

偶然误差应具有抵偿性,误差和应接近 0

若已知中误差 σ

u=i=1nΔiσnN(0,1)

σ 未知,可用误差列估计中误差 m 代替:

ui=1nΔimn

双侧检验:

|u|uα/2

若不满足,说明误差总和偏离零较明显,可能存在系统误差。

单个误差超限检验

偶然误差具有有界性。通常用极限误差判断单个误差是否异常:

|Δi|km

常用 k=3,即

|Δi|3m

若某个误差超过限值,应优先检查粗差、记录错误或观测条件异常。

后验方差检验

测量平差依赖函数模型和随机模型。若模型正确,则先验单位权方差 σ02 与后验单位权方差估值

σ^02=VTPVr

应统计一致。

建立假设

H0:σ2=σ02

检验统计量为

χ2=rσ^02σ02=VTPVσ02χ2(r)

接受域为

qα/2(χr2)VTPVσ02q1α/2(χr2)

若拒绝 H0,说明后验方差与先验方差不一致,可能原因包括:

  • 函数模型有偏差
  • 起算数据不正确
  • 观测值含系统误差或粗差
  • 定权不正确
  • 参数近似值太差,线性化误差明显

参数区间估计

区间估计给出参数真值可能出现的范围,以及该范围包含真值的可信程度。

总体均值的置信区间

方差已知:

μ[x¯uα/2σn,x¯+uα/2σn]

方差未知:

μ[x¯tα/2(n1)sn,x¯+tα/2(n1)sn]

置信度为 1α

总体方差的置信区间

对正态总体,有

(n1)s2σ2χ2(n1)

因此总体方差的 1α 置信区间为

σ2[(n1)s2q1α/2(χn12),(n1)s2qα/2(χn12)]

解题模板

  1. 写假设

    • H0:无显著差异或无系统误差
    • H1:有显著差异或有系统误差
  2. 判断检验对象

    • 均值问题:ut

    • 方差问题:χ2F

    • 后验方差问题:χ2(r)

  3. 写统计量和分布

    例:

    t=x¯μ0s/nt(n1)
  4. 查临界值,写接受域

    例如双侧:

    |t|tα/2(n1)
  5. 代入样本值判断,解释结论

    • 接受 H0:没有显著系统误差、精度无显著差异、标称精度基本一致
    • 拒绝 H0:存在显著系统误差、精度有显著差异、随机模型或函数模型可能有问题