Skip to content

因果分解的思想与方法 —— 隐映照定理

因果分解:理解事物之间的关系

当我们研究两个集合时,不仅要看它们各自包含什么,还要看它们之间是如何相互关联的。这种关联关系在数学中被称为 “映射” 或 “映照我们可以用一个简单的符号来表示这种关系:

自变量 因变量

这里的 “自变量” 是影响变化的因素,而 “因变量” 则是被影响的结果。

在数学分析中,我们通常研究的是那些有有限自由度的系统。那么,如何描述这些系统中的事物呢?主要有两个步骤:

  1. 表征:描述事物的具体内容。
  2. 关系:描述事物之间的关联。

举个例子,假设我们要描述一个事物,可以用以下方式:

  • 表征:用一组变量来表示事物的状态,比如:xRm

    这里的 x 是描述事物的变量。

  • 关系:用方程来描述这些变量之间的关系,比如:f(x)=0Rs

    这里的 f 是描述变量之间关系的方程。

不过,这种描述方式有一个问题:它没有明确指出哪些变量是 “因自变量哪些是 “果因变量

隐映照定理就是用来解决这个问题的。它帮助我们进行因果分解,也就是明确区分哪些变量是原因,哪些是结果。

定理 (隐映照定理)设 Dx×Dy{ξ,η}f(ξ,η)Rq,其中 DxRp,DyRq, Dx,Dy 均为开集。

设有 f(ξ0,η0)=0Rq。如有 Dfη(ξ0,η0) 非奇异,且 f(x,y)C1(Dx×Dy,Rq) 则:

ξ0 的周围作一个邻域 Bλ(ξ0),设有 ξBλ(ξ0)

η0 的周围作一个邻域 Bμ(η0)

!ηBμ(η0), s.t. f(ξ,η)=0Rq.

这就构造出一个映照Bλ(ξ0)ξη(ξ)Bμ(η0). 此映照满足 η(ξ)C1(Bλ(x0),Rq)

解释:

在上面的定理中,我们将自变量进行了因果分解:ξ 为因,而 η 为果。

下面我们将以图示化的方式解释上面的定理。

在上图中,我们把坐标系分为两部分:因部分 ξ,果部分 η.

我们作一个集合:={(ξ,η)|f(ξ,η)=0Rq}

我们已知 f(ξ0,η0)=0Rq,则 (ξ0,η0). 我们在 ξ0 的周围作一个球 Bλ(ξ0),然后我们可以垂直因坐标系作一个圆柱,其在因坐标系上的投影就是球 Bλ(ξ0),如图所示。同理可以在 η0 的周围作球 Bμ(η0) 及其圆柱。这两个圆柱会产生一个交圆柱。我们接下来的研究就产生在这个交圆柱中。

Bλ(ξ0) 取一个点 ξ ,然后向上作一个垂线(图中红线与交圆柱会产生一个公共线段(图中实线段根据定理,在这个实线段上,有且只有一个点位于 内,即:

!ηBμ(η0), s.t. f(ξ0,η0)=0Rq.

定理的证明

引理 1 压缩映照定理

设有向量值映照 f(x):RmDxxf(x)Rm,其中 Dx 是闭集。

f(x) 满足:α[0,1),x,yDx, s.t. d(f(x),f(y))αd(x,y).

则有:

!xDx, s.t. f(x)=xRm.

证明

我们之前学习数列极限时,有过这样的经验:给出递推公式的数列,往往会收敛于其不动点

根据这一点,我们尝试构造如下点列:

取点列 x0,x1,...,xn,满足

x1=f(x0)x2=f(x1)...xn=f(xn1)

与题中式子尝试建立联系:

d(f(xn),f(xn1))=d(xn+1,xn)αd(xn,xn1)

因此有

d(xn+p,xn)d(xn+p,xn+p1)+...+d(xn+1,xn)i=0p1αid(xn+1,xn)αnd(x1,x0)i=0p1αi=αn(1αp)1αd(x1,x0)0.

根据 Cauchy 收敛原理,点列 {xn} 收敛。

对递推公式 xn=f(xn1) 两边取极限,有

xDx(),x=f(x).

下面证明 x 是唯一的,即不依赖于初始值 x0 的选取。

设有点列 {x~n}{x^n},它们分别集聚于 x~x^,其中假设 x~x^ 则有

d(x~,x^)=d(f(x~),f(x^))αd(x~,x^)<d(x~,x^).

这与假设 x~x^ 是矛盾的!

因此

!xDx, s.t. f(x)=xRm.

引理 2 一个有关矩阵范数的不等式

设有向量值映照 f(x):RmDxxf(x)Rn,现欲估计

|f(x+Δx)f(x)|Rn.

对于一个向量值映照,如果我们想要利用我们熟悉的一元函数的结论,需要将其直线单参数化

但困难之处在于,我们之前处理的大多是 f(x+Δx)f(x),而不是其模长。那么我们该如何将模长的结果单参数化呢?

不妨考虑模长的平方,这样就省去了开根号这一步。

容易发现:令

φ(t)=[f(x+tΔx)]T[f(x+Δx)f(x)]

则有

|f(x+Δx)f(x)|Rn2=φ(1)φ(0).

于是我们就可以利用 Lagrange 中值定理,将上式的结果化为

|f(x+Δx)f(x)|Rn=φ˙(θ).

接下来我们就需要计算

φ˙(θ)=[Df(x+θΔx)Δx]T[f(x+Δx)f(x)].

根据 Cauchy-Schwarz 不等式,两个向量的内积不超过它们的模长之积,有

|f(x+Δx)f(x)|Rn2|Df(x+θΔx)Δx|Rn|f(x+Δx)f(x)|Rn.

再根据矩阵范数的三角不等式,有

|f(x+Δx)f(x)|Rn|Df(x+θΔx)|Rn×n|Δx|Rnsupθ[0,1]|Df(x+θΔx)|Rn×n|Δx|Rn.

这说明两个向量值映照的因变量在两点之间的距离,可以由它的 Jacobi 阵的范数和自变量的距离来控制。

证明隐映照定理

考虑将此问题转化为不动点的唯一性问题。考虑构造

ϕξ(η):Bμ(η)ηϕξ(η)=η(Dηf)1(ξ0,η0)f(ξ,η)Rq

易证:

ϕξ(η)=ηf(ξ,η)=0Rq.

现估计

    |ϕξ(η)η0|Rq=|ϕξ(η)ϕξ(η0)+ϕξ(η0)η0|Rq|ϕξ(η)ϕξ(η0)|Rq+|ϕξ(η0)η0|Rq

根据有限增量公式,有估计

|ϕξ(η)ϕξ(η0)|supθ(0,1)|Dϕξ(η0+θ(ηη0))|Rq×q|ηη0|Rq.

考虑到

Dϕξ(η)=Iq(Dηf)1(ξ0,η0)Dηf(ξ,η).

估计

    |Dϕξ(η)|Rq×q=|Iq(Dηf)1(ξ0,η0)Dηf(ξ,η)|Rq×q=|(Dηf)1(ξ0,η0)[Dηf(ξ0,η0)Dηf(ξ,η)]|Rq×q|(Dηf)1(ξ0,η0)|Rq×q|Dηf(ξ0,η0)Dηf(ξ,η)|Rq×q.

以上我们设定 ξBλ(ξ0),ηBμ(η0).

欲运用压缩映照定理,需满足包含性条件压缩性条件。要证包含性条件,根据上面的分析,只需证

|Dϕξ(η)|Rq×q<1.

ξBλ~(ξ0),μBμ~(η0),其中 λ~<λ,μ~<μ,使得

|Dηf(ξ0,η0)Dηf(ξ,η)|Rq×q<|Dηf(ξ0,η0)|Rq×q.

此处运用了 f(ξ,η)C1(Dξ×Dη;Rq).

NOTE

在此处粗体的 D 表示 Jacobi 阵,手写体的 D 表示定义域。

则有

|Dϕξ(η)|Rq×q<1.

包含性条件已然成立。下面证明压缩性条件

估计

    |ϕξ(η2)ϕξ(η2)|Rqsupθ(0,1)|Dξ(η1+θ(η2η1))|Rq×q|η2η1|Rq<|η2η1|.

因此压缩性条件成立。

故映照 ϕξ(η) 有且只有一个不动点。因此在 ξ0 的一个邻域 Bλ(ξ0)η0 的一个邻域 Bμ(η0) 内存在从 ξη 的一个映照 ηξ,使得

f(ξ,ηξ)=0.

下面证明这个映照满足 ηξC1(Bλ(ξ0);Rq).

连续性

考虑 ξ,ξ+ΔξBλ(ξ0),估计

    η(ξ+Δξ)η(ξ)=ϕ(ξ+Δξ,η(ξ+Δξ))ϕ(ξ,η(ξ))=Dξϕ(ξ,η(ξ))Δξ+Dηϕ(ξ,η(ξ))[η(ξ+Δξ)η(ξ)]+o(|Δξ|Rm2+|ηξ+Δξηξ|Rm2)=(Dηf)1(ξ0,η0)·Dξf(ξ,ηξ)·Δξ+(Iq(Dηf)1(ξ0,η0)·Dηf(ξ,ηξ))[η(ξ+Δξ)η(ξ)]+o(|Δξ|Rm).

则有

(Dηf)1(ξ0,η0)·Dηf(ξ,ηξ)·[ηξ+Δξηξ]=(Dηf)1(ξ0,η0)·Dξf(ξ,ηξ)·Δξ(1+o(1)).

设定 Dηf(ξ0,η0) 的一个邻域内非奇异,则有

η(ξ+Δξ)η(ξ)=(Dηf)1(ξ,ηξ)Dξf(ξ,ηξ)Δξ+o(Δξ).

这就是可微性。