[變分法] 連續泛函極值的必要條件

這次要介紹最簡單形式的泛函極值問題的必要條件，此條件一般又稱之為 Euler-Largrange Eqution。此方程可謂泛函極值的房角石，亦為之後在最佳控制理論中的最大值原理扮演開路先鋒，是極為重要的角色。在介紹之前，我們先做一般性的用語與基本性質介紹。

======================
Definition: 泛函
令 $\Omega$ 為賦範函數空間 (normed function space)，若對任意函數 $x(t) \in \Omega$ 都存在一個實數與之對應，則我們稱 $J$ 是定義在 $\Omega$ 上的 泛函 (functional)，記作 $J(x(t))$
======================

Comment:
1. 簡而言之，泛函一詞即表示為由函數空間映射到實數軸上的函數 $J: \Omega \to \mathbb{R}$ 。
2. 再以下的討論中，集合 $\Omega$ 又稱為泛函 $J$ 的 容許集 (admissible set)。

現取 $x_1, x \in \Omega$ 且 $\delta x := x_1 - x$ ，我們定義關於 $\delta x$ 的泛函增量 (increment) 如下
\[
\Delta J(\delta x) := J(x_1) - J(x) = J( x + \delta x) - J(x)
\]則由此泛函增量，我們可以定義何謂泛函的變分。

======================
Definition: 泛函的變分
給定泛函 $J : \Omega \to \mathbb{R}$，若存在一線性泛函 $L(x, \delta x)$ 使得泛函增量可被表為
\[
\Delta J(\delta x) = L(x, \delta x) + r(x, \delta x) \cdot | |\delta x||
\]其中 $r(x, \delta x)$ 為 其他高階剩餘項(remainder) 滿足當 $| |\delta x|| \to 0 \Rightarrow r(x, \delta x) \to 0$，則我們稱上式中的 $L(x, \delta x)$ 為 $J(x)$ 的 變分 (variation)，記作 $\delta J := L(x, \delta x)$
======================

Comment:

1. 上述定義中的線性泛函項 $L$ 與其他高階剩餘項 $r$，可視為透過 Taylor 級數展開而得。

2. 變分 (variation) 一詞在文獻中又稱 differential

3. 若泛函變分存在，則該變分為唯一，在此不證明，有興趣讀者可參閱 [1]。
4. 關於線性泛函及其相關定義請讀者可參閱 [變分法] 淺論線性泛函
5. 有些文獻定義的泛函是透過所謂 Gateaux differentials 與 Freshet differential，但為求論述簡潔，在此不多作介紹，有興趣的讀者可以參閱 [2]

======================
Theorem: 泛函極值與變分關係
給定泛函 $J : \Omega \to \mathbb{R}$，若其變分存在，則其變分可表為參數 $\alpha$ 的方向導數，亦即變分滿足下式
\[\delta J(x(t)) = {\left. {\frac{\partial }{{\partial \alpha }}J(x(t) + \alpha \delta x(t))} \right|_{\alpha = 0}}\]======================

Proof: 給定泛函 $J : \Omega \to \mathbb{R}$ 且假設其變分存在，我們要證明
\[\delta J(x(t)) = {\left. {\frac{\partial }{{\partial \alpha }}J(x(t) + \alpha \delta x(t))} \right|_{\alpha = 0}}
\]首先由 $\delta J$ 存在可知：存在一線性泛函 $L$ 始得泛函增量 $\Delta J$滿足
\[\begin{align*}
\Delta J &= J\left( {x + \alpha \delta x} \right) - J\left( x \right) \hfill \\
&= L(x,\alpha \delta x) + r(x,\alpha \delta x) \cdot || \alpha \delta x || \hfill \\
\end{align*}
\]由於 $L$ 為線性泛函，故 $L(x,\alpha \delta x) = \alpha L(x,\delta x)$，現在觀察
\[\begin{align*}
{\left. {\frac{\partial }{{\partial \alpha }}J(x(t) + \alpha \delta x(t))} \right|_{\alpha = 0}} &= \mathop {\lim }\limits_{\alpha \to 0} \frac{{J(x + \alpha \delta x) - J\left( x \right)}}{\alpha }\\
&= \mathop {\lim }\limits_{\alpha \to 0} \frac{{L(x,\alpha \delta x) + r(x,\alpha \delta x)||\alpha \delta x||}}{\alpha } \hfill \\
&= \mathop {\lim }\limits_{\alpha \to 0} \frac{{L(x,\alpha \delta x)}}{\alpha } + \underbrace {\mathop {\lim }\limits_{\alpha \to 0} \frac{{r(x,\alpha \delta x) ||\alpha \delta x||}}{\alpha }}_{ = 0} \hfill \\
&= \mathop {\lim }\limits_{\alpha \to 0} \frac{{\alpha L(x,\delta x)}}{\alpha } \hfill \\
&= L(x,\delta x) = \delta J(x) \;\;\;\;\; \square
\end{align*}
\]

======================
Theorem:
令 $J$ 為泛函且其變分存在，若 $J(x)$ 在 $x_0 \in \Omega$ 有(局部)極值，則其在 $x_0$ 之變分
\[
\delta J(x_0) =0
\] ======================

Comment: 上述定理中的 $x_0$ 又稱為泛函 $J$ 的臨界點(critical point) 或者稱不動點 (stationary point)。

Proof: 由於變分存在，我們可將變分用以單變數參數 $\alpha$ 的方向導數表示
\[{\left. {\delta J\left( x \right) = \frac{\partial }{{\partial \alpha }}J(x + \alpha \delta x)} \right|_{\alpha = 0}}\]由於 $J(x)$ 在 $x_0 \in \Omega$ 有局部極值，故我們可知 $\alpha =0$ 為$J(x_0 + \alpha \delta x)$ 的局部極值 (以極小值為例，可知對任意 $\alpha \in \mathbb{R}$， $J(x_0) \leq J(x_0 + \alpha \delta x)$，且極小值發生在 $\alpha = 0$)，故
\[{\left. {\delta J\left( {{x_0}} \right) = \frac{\partial }{{\partial \alpha }}J({x_0} + \alpha \delta x)} \right|_{\alpha = 0}} = 0\;\;\;\; \square
\]

在討論一般設定之後，以下我們開始針對特殊形式的泛函來建構必要條件：考慮泛函
\[
J(x(t)) := \int_{t_0}^{t_1} F(t,x,\dot{x}) dt; \;\;\; x(t_0) :=x_0; \;\;\; x(t_1) \doteq x_1
\]且令其 admissible set 為
\[
\Omega := \{x(t) : x(t) \in C^2[t_0, t_1], \; x(t_0) = x_0, x(t_1) = x_1\}
\]且 $F(t, x, \dot{x})$ 為 $C^2$ (二階可導且連續)，我們欲求上述泛函極值的必要條件，此結果極為鼎鼎大名的 Euler-Largrange 方程，但在我們證明主要定理之前，底下我們先給個前置定理，此定理又稱為變分基本定理。

======================
Lemma: 變分基本引理
設函數 $F(t)$ 在區間 $[t_0, t_1]$ 上連續，若對於任意滿足 $\eta(t_0) = \eta(t_1) =0$ 的充分光滑函數 $\eta(t)$ 我們都有
\[
\int_{t_0}^{t_1} F(t) \eta(t) dt =0
\]則 $F(t) = 0$ 對 $t \in [t_0,t_1]$
======================

Proof: 利用反證法，假設存在 $\xi \in (t_0,t_1)$ 使得 $F(\xi) \neq 0$，欲證明矛盾。不失一般性情況下我們假設 $F(\xi) >0$ 則由於 $F$的連續性，可知必存在以 $\xi$ 為中心的鄰域 $N_\xi :=(\xi_1,\xi_2) \subset (t_0, t_1)$ 使得對任意 $t \in N_\xi$，我們有 $F(t) > 0$。現在我們構造 $\eta(t)$ 函數如下
\[\eta \left( t \right): = \left\{ \begin{gathered}
0,\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}t \in \left[ {{t_0},{\xi _1}} \right) \hfill \\
{\left[ {\left( {t - {\xi _1}} \right)\left( {t - {\xi _2}} \right)} \right]^2},\begin{array}{*{20}{c}}
{}&{}
\end{array}t \in \left[ {{\xi _1},{\xi _2}} \right] \hfill \\
0,\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}t \in \left( {{\xi _2},{t_1}} \right] \hfill \\
\end{gathered} \right.\]且注意到上述 $\eta(t)$ 函數滿足 $\eta(t_0) = \eta(t_1) = 0$ 且為連續函數，然而若我們觀察
\[
\int_{t_0}^{t_1} F(t) \eta(t) dt = \int_{\xi_1}^{\xi_2} F(t) \eta(t) dt > 0
\]此結果與我們的假設矛盾。$\square$

======================
Theorem: 泛函極值的必要條件 Euler-Lagrange Equation
設函數 $F(t, x, \dot{x})$ 具有連續二階偏導數，且設泛函\[
J(x(t)) := \int_{t_0}^{t_1} F(t,x,\dot{x}) dt; \;\;\; x(t_0) :=x_0; \;\;\; x(t_1) \doteq x_1
\]在 $x(t) \in \Omega$ 達到極值，則 $x(t)$ 滿足下列方程
\[\frac{\partial }{{\partial x}}F\left( {t,x,\dot x} \right) - \frac{d}{{dt}}\left( {\frac{\partial }{{\partial \dot x}}F\left( {t,x,\dot x} \right)} \right) = 0\]
======================

Proof: 首先令 $\phi(t) := \delta x(t)$，則由於 $x(t_0)=x_0$與 $x(t_1) = x_1$ 可知，$\phi(t)$ 滿足 $\phi(t_0) = \phi(t_1)=0$，現在由泛函極值與變分的關係可知下式必定成立：
\[\delta J\left( {x\left( t \right)} \right) = \left. {\frac{\partial }{{\partial \alpha }}J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right)} \right|_{\alpha = 0} = 0 \;\;\;(\star)
\]現在觀察
\[
J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right) = \int_{{t_0}}^{{t_1}} F (t,x + \alpha \phi ,\dot x + \alpha \dot \phi )dt
\]故我們可先行計算
\[{\left. {\frac{\partial }{{\partial \alpha }}J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right)} \right|_{\alpha = 0}} = {\left. {\frac{\partial }{{\partial \alpha }}\int_{{t_0}}^{{t_1}} F (t,x + \alpha \phi ,\dot x + \alpha \dot \phi )dt} \right|_{\alpha = 0}}
\]由 Libneiz Rule 可得
\[\begin{align*}
{\left. {\frac{\partial }{{\partial \alpha }}J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right)} \right|_{\alpha = 0}} &= {\left. {\frac{\partial }{{\partial \alpha }}\int_{{t_0}}^{{t_1}} F (t,x + \alpha \phi ,\dot x + \alpha \dot \phi )dt} \right|_{\alpha = 0}} \hfill \\
&= {\left. {\int_{{t_0}}^{{t_1}} {\frac{\partial }{{\partial \alpha }}F} (t,x + \alpha \phi ,\dot x + \alpha \dot \phi )dt} \right|_{\alpha = 0}} \hfill \\
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}}\phi + \frac{{\partial F}}{{\partial \dot x}}\dot \phi } \right]} dt} \right|_{\alpha = 0}}\;\;\;\; (*)
\end{align*}
\]注意到上述積分第二項可透過 integration by part 求得
\[\int_{{t_0}}^{{t_1}} {\frac{{\partial F}}{{\partial \dot x}}\dot \phi dt} = \left. {\frac{{\partial F}}{{\partial \dot x}}\phi } \right|_{{t_0}}^{{t_1}} - \int_{{t_0}}^{{t_1}} {\phi \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} dt\]由於 $\phi(t_0) = \phi(t_1) = 0$，故我們得
\[\begin{gathered}
\int_{{t_0}}^{{t_1}} {\frac{{\partial F}}{{\partial \dot x}}\dot \phi dt} = \underbrace {\left. {\frac{{\partial F}}{{\partial \dot x}}\phi } \right|_{{t_0}}^{{t_1}}}_{ = 0} - \int_{{t_0}}^{{t_1}} {\phi \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} dt \hfill \\
\Rightarrow \int_{{t_0}}^{{t_1}} {\frac{{\partial F}}{{\partial \dot x}}\dot \phi dt} = - \int_{{t_0}}^{{t_1}} {\phi \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} dt \hfill \\
\end{gathered}
\]現在將其帶回 $(*)$ 我們得到
\[\begin{align*}
{\left. {\frac{\partial }{{\partial \alpha }}J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right)} \right|_{\alpha = 0}}
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}}\phi - \phi \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} \right]} dt} \right|_{\alpha = 0}} \hfill \\
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}} - \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} \right]} \phi dt} \right|_{\alpha = 0}} \hfill \\
\end{align*}
\]由於 $(\star)$ 可知，
\[\begin{align*}
{\left. {\frac{\partial }{{\partial \alpha }}J\left( {x\left( t \right) + \alpha \phi \left( t \right)} \right)} \right|_{\alpha = 0}}
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}}\phi + \frac{{\partial F}}{{\partial \dot x}}\dot \phi } \right]} dt} \right|_{\alpha = 0}} \hfill \\
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}}\phi - \phi \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} \right]} dt} \right|_{\alpha = 0}} \hfill \\
&= {\left. {\int_{{t_0}}^{{t_1}} {\left[ {\frac{{\partial F}}{{\partial x}} - \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} \right]} \phi dt} \right|_{\alpha = 0}} = 0 \hfill \\
\end{align*}
\]由於 ${\frac{{\partial F}}{{\partial x}} - \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}}$ 在區間 $[t_0,t_1]$ 連續，且 $\phi$ 滿足 $\phi(t_0) = \phi(t_1) =0$ 且 $\phi \in C^2$，利用前述引理可知在 $[t_0,t_1]$ 上，
\[{\frac{{\partial F}}{{\partial x}} - \frac{d}{{dt}}\frac{{\partial F}}{{\partial \dot x}}} = 0\;\;\;\; \square\]

[1] I. M. Gelfand and S. V. Fomin, Calculus of Variations, 2000
[2] David G. Luenberger, Optimization By Vector Space Methods, 1997

[數學分析] 淺談各種基本範數 (Norm)

這次要介紹的是數學上一個重要的概念： Norm：一般翻譯成範數 (在英語中 norm 有規範的意思，比如我們說normalization就是把某種東西/物品/事件做正規化，也就是加上規範使其正常化)，不過個人認為其實翻譯成範數也是看不懂的...這邊建議把 Norm 想成長度就好 (事實上norm是長度的抽象推廣)，也許讀者會認為好端端的長度不用，為何又要發明一個 norm 來自討苦吃?? 既抽象又艱澀。事實上想法是這樣的：比如說現在想要比較兩個數字 $3$ , $5$ 之間的大小，則我們可以馬上知道 $ 3 < 5 $；同樣的，如果再考慮小數與無理數如 $1.8753$ 與 $\pi$，我們仍然可以比較大小 $1.8753 < \pi = 3.1415...$ 故可以發現我們有辦法對 "純量" 做明確的比大小，WHY? 因為前述例子中 $3$, $5$, $1.8753$ or $\pi$ 其各自的大小有辦法被 "measure "! 但是如果是現在考慮的是一組數字我們如何去measure 其大小呢?? 比如說 \[x:=[1, -2, 0.1, 0 ]^T \]上式的大小該是多少? 是 $1$? $-2$? $0.1$??? 再者如果更過分一點，我們考慮一個矩陣 \[A = \left[ {\begin{array}{*{20}{c}} 1&2\\ 3&4 \end{array}} \right] \]，想要知道這個矩陣的大小又該怎麼辦?? 是 $1$ ? $2$ 還是 $4$ ?..其實現階段我們說不清楚。也正是如此，可以發現我們確實需要新的 "長度" 的定義來幫助我們如何去 measure 矩陣/向量/甚至是函數的大小。故此，我們首先定義甚麼是Norm，(也就是把 "長度" or "大小" 的本質抽離出來) ================== Definition: Norm 考慮 $V$ 為一個向量空間(Vector space)，則我們說 Norm 為一個函數 $||\cdot|| : V \rightarrow \mathbb{R}$ 且滿足下列性質

閱讀完整內容

謝宗翰的隨筆

搜尋此網誌

[變分法] 連續泛函極值的必要條件

標籤

留言

張貼留言

這個網誌中的熱門文章

[數學分析] 什麼是若且唯若 "if and only if"

[數學分析] 淺談各種基本範數 (Norm)