Skip to content

6 统计量及其分布

概念与符号约定

研究一个总体,该总体是一个随机变量 XX 的分布称为总体分布

从总体中抽取 n 个个体,称为样本,记作 (X1,X2,,Xn)n 称为样本容量样本大小

抽样得到的 n 个数据 x1,x2,,xn 称为样本观测值

统计量

对于样本的函数 h(X1,X2,,Xn),只要不包含未知参数(即可以根据样本观测值直接求出均称为统计量

  • 样本均值 X¯=1ni=1nXi
  • 样本 k 阶原点矩 Ak=1ni=1nXikk=1,2,
  • 样本 k 阶中心矩 Bk=1ni=1n(XiX¯)k
  • 样本 2 阶中心矩 Sn2=1ni=1n(XiX¯)2
  • 样本方差 S2=1n1i=1n(XiX¯)2
  • 最小次序统计量 X(1)=min1inXi
  • 最大次序统计量 X(n)=max1inXi

定理 对于任意常数 c

i=1n(XiX¯)2=i=1n(Xic)2n(X¯c)2

TIP

c 的常用候选:0

插入 0 后变为:

i=1n(XiX¯)2=i=1nXi2nX¯2

定理(X1,,Xn) 是取自总体 X 的一个样本,若 E(X2)<+,则

E(X¯)=E(X),Var(X¯)=Var(x)nE(Sn2)=n1nVar(x),E(S2)=Var(X)

定理n

X¯PE(X),S2PVar(X),Sn2PVar(X),

常用分布

χ2 分布

定义X1,X2,,Xn 为独立同分布随机变量,有 XiN(0,1)。则定义随机变量 U=i=1nXi2 服从自由度为 nχ2 分布,记为 Uχ2(n)

χ2 分布的密度函数和分布函数均不能用初等函数表示。

  • 期望 E(X)=n
  • 方差 Var(X)=2n

特别地,

  • XN(0,1),则 X2χ2(1)
  • 自由度为 2χ2 分布就是参数为 12指数分布,即 E(12)=χ2(2)

显然 χ2 分布具有可加性:若 Y1χ2(m)Y2χ2(n),且 Y1,Y2 相互独立,则有 Y1+Y2χ2(m+n)

t 分布

定义 设随机变量 XN(0,1),Yχ2(n)X,Y 相互独立,称随机变量 T=XY/n 所服从的分布为自由度 n 的 t 分布,记为 Tt(n)

n30 时,t 分布可使用标准正态分布近似替代。

期望 E(X)=0

t 分布也称学生分布。

F 分布

定义 设随机变量 Uχ2(m),Vχ2(n)U,V 相互独立,则称随机变量 F=U/mV/n 服从自由度为 (m,n) 的 F 分布,记为 FF(m,n)

正态分布抽样定理

(X1,,Xn) 是取自正态总体 N(μ,σ2) 的一个样本,有

  1. X¯N(μ,σ2n),即 X¯μσ/nN(0,1)
  2. (n1)S2σ2=nSn2σ2χ2(n1)
  3. X¯μS/nt(n1),即 X¯μS2/nt(n1)
  4. X¯S2 相互独立。

IMPORTANT

非常重要,要求记忆。

NOTE

对 2 的理解

(n1)S2σ2=i=1n(XiX¯σ)2=i=1n(Xi)2χ2(n1)

(X1,,Xn) 相比原本的 (X1,,Xn) 少了一个自由度,是因为标准化之后 X¯ 这一信息抹掉了,多了限制条件 Xi=0

次序统计量的分布

一般地,X(1),X(n) 相互独立。

最大次序统计量

X(n)=max1inXiFX(n)(x)=[F(x)]nfX(n)(x)=ddxFX(n)(x)=n[F(x)]n1f(x)

最小次序统计量

X(1)=min1inXiFX(1)(x)=1[1F(x)]nfX(1)(x)=ddxFX(1)(x)=n[1F(x)]n1f(x)