Skip to content

设有约束(可认为是 Rm 的一个子集)

Σ={xRm|f(x)=0Rr}.

其上定义有目标函数

Σxθ(x)R.

现求 xΣ,满足

θ(x)=supΣθ(x)infΣθ(x).

这类问题称为约束上的最值问题。

首先,根据 f(x)=0Rr,我们可以对其进行因果分解

F(ξ,η)=f(x),其中 ξRmr,ηRr。若可因果分解,需有 DηF(ξ,η)Rr×r 非奇异。假设此条成立。

则存在 η=η(ξ).

θ(x)=θ(ξ,η):=θ~(ξ).

我们知道,最值点一般是临界点边界点

NOTE

  • 临界点:各个一阶偏导数为零的点,不一定是极值点。

  • 边界点:在定义域的边界集合 Dx 上的点。

我们先来考虑临界点的情况。

θ~e~(ξ)=Dθ~(ξ)e~,|e~|Rr=1.

根据临界点的定义,有

Dθ~(ξ)=0R1×r.

计算

Dθ~(ξ)=Dξθ+DηθDη(ξ)=DξθDηθ(Dηf)1Dξf.

则有

DξθDηθ(Dηf)1Dξf=0R1×r.

上面这个方程叫做临界点方程,它指出了所有临界点所满足的条件。

下面我们来判别临界点的类别。判别方法是利用无限小增量公式,展开至二阶项

考虑

θ(ξ+Δξ,η+Δη)θ(ξ,η)=[Dξθ,Dηθ][ΔξΔη]+12[(Δξ)T,(Δη)T][DξDξθDξDηθDηDξθDηDηθ][ΔξΔη]+o(|Δξ|Rs2+|Δη|Rr2).(1)

再考虑约束上的无限小增量公式:

fα(ξ+Δξ,η+Δη)fα(ξ,η)=[Dξfα,Dηfα][ΔξΔη]+12[(Δξ)T,(Δη)T][DξDξfαDξDηfαDηDξfαDηDηfα][ΔξΔη]+o(|Δξ|Rs2+|Δη|Rs2).(2)

对于 (2) 式左边,如果我们假设点 (ξ+Δξ,η+Δη)(ξ,η) 均在 Σ 上,则左边等于 0.

(2) 式左右两边同时乘上 λα,其中 α=1,2,,r,这 r 个式子可统一为一个矩阵表达式,然后加到 (1) 式上,可有:一阶项系数为

Δξ: Dξθ+λαDξfα=Dξθ+ΛTDξf,Δη: Dηθ+λαDηfα=Dηθ+ΛTDηf.

由题意,(ξ,η) 为临界点,故一阶项系数都为零。

Δη 的系数为零,得

ΛT=Dηθ(Dξf)1.

代入到 Δξ 的系数项中,有

DξθDηθ(Dξf)1Dξf.

上式正好是临界点方程,自然为 0.

接下来我们来处理二阶项

12[(Δξ)T,(Δη)T]HL(ξ,η)[ΔξΔη].

其中

L(ξ,η,λ)=θ(ξ,η)ΛTf(ξ,η).

Δη=η(ξ+Δξ)η(ξ)=Dη(ξ)Δξ+o(|Δξ|Rs).

[ΔξΔη]=[ΔξDη(ξ)Δξ]=[IsDη(ξ)]Δξ.

故二阶项为

12(Δξ)T[Is,(Dη)T(ξ)]HL(ξ,η)[IrDη(ξ)]Δξ.

显然这是一个二次型。假如其系数矩阵是正定矩阵,根据正定矩阵的性质,则 (ξ,η) 为极小值点;负定则为极大值点;不定矩阵则需要引入张量进行判别。