考慮線性非時變 (Linear Time-Invariant, LTI)系統利用狀態空間表示:
\[
{\bf \dot x} = A {\bf x} + B {\bf u}
\] 回憶在大學部自動控制課程中,我們知道 LTI 系統穩定 的 充分必要條件 為系統矩陣 $A$ 之特徵值具有負實部 (或者等價論述為 極點 pole 落在 複數平面的左半面)。現在我們想問若 系統為 線性時變 (Linear Time-Varying, LTV)系統是否此條件依然成立?
答案是否定的,以下為一個極為出色的反例:考慮線性時變系統 ${\bf \dot x} = A(t) {\bf x} $ 其中
\[A\left( t \right): = \left[ {\begin{array}{*{20}{c}}
{ - 1}&{{e^{2t}}}\\
0&{ - 1}
\end{array}} \right]
\] 且給定初始狀態為 $x_1(0) = x_2(0)=1$ 則由於此系統 $A(t)$ 矩陣為三角矩陣,其特徵值為對角線元素,亦即 $\lambda_{1,2} = -1$,具有負實部。然而,若我們求解此 LTV 系統,亦即觀察
\[{\bf{\dot x}}\left( t \right) = \left[ {\begin{array}{*{20}{c}}
{ - 1}&{{e^{2t}}}\\
0&{ - 1}
\end{array}} \right]\left[ \begin{array}{l}
{x_1}\left( t \right)\\
{x_2}\left( t \right)
\end{array} \right] = \left[ \begin{array}{l}
- {x_1}\left( t \right) + {e^{2t}}{x_2}\left( t \right)\\
- {x_2}\left( t \right)
\end{array} \right]\]故我們可首先解得
\[\begin{array}{*{20}{l}}
{{{\dot x}_2}\left( t \right) = - {x_2}\left( t \right)}\\
\begin{array}{l}
\Rightarrow {x_2}\left( t \right) = {e^{ - t}}{x_2}\left( 0 \right)\\
\Rightarrow {x_2}\left( t \right) = {e^{ - t}}
\end{array}
\end{array}
\]再將此 $x_2(t)$ 帶回 $\dot x_1(t)$ 式中,可求解 $x_1$ 如下
\[\begin{array}{*{20}{l}}
{{{\dot x}_1}\left( t \right) = - {x_1}\left( t \right) + {e^{2t}}{x_2}\left( t \right)}\\
{ \Rightarrow {{\dot x}_1}\left( t \right) = - {x_1}\left( t \right) + {e^{2t}}{e^{ - t}}}\\
{ \Rightarrow {x_1}\left( t \right) = {e^{ - t}}{x_1}\left( 0 \right) + \int_0^t {{e^{ - \left( {t - \tau } \right)}}{e^\tau }d\tau } }\\
{ \Rightarrow {x_1}\left( t \right) = {e^{ - t}} + {e^{ - \left( t \right)}}\int_0^t {{e^{2\tau }}d\tau } }\\
{ \Rightarrow {x_1}\left( t \right) = \frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}}
\end{array}\]故系統之解為
\[{{\bf{x}}\left( t \right) = \left[ \begin{array}{l}
{e^{ - t}}\\
\frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}
\end{array} \right]}\]但注意到若我們計算上述之狀態的 2-norm 且取極限 $t \to \infty$ 會發現
\[\begin{array}{l}
\mathop {\lim }\limits_{t \to \infty } \left\| {{\bf{x}}\left( t \right)} \right\| = \mathop {\lim }\limits_{t \to \infty } \left\| {\left[ \begin{array}{l}
{e^{ - t}}\\
\frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}
\end{array} \right]} \right\|\\
= \mathop {\lim }\limits_{t \to \infty } {\left( {\left[ {\begin{array}{*{20}{c}}
{{e^{ - t}}}&{\frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}}
\end{array}} \right]\left[ \begin{array}{l}
{e^{ - t}}\\
\frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}
\end{array} \right]} \right)^{1/2}}\\
= \mathop {\lim }\limits_{t \to \infty } {\left( {{e^{ - 2t}} + {{\left( {\frac{1}{2}{e^t} + \frac{1}{2}{e^{ - \left( t \right)}}} \right)}^2}} \right)^{1/2}} = \infty
\end{array}\]亦即系統狀態發散。
上述結果闡釋了對於 LTV 系統而言,負實部特徵值 (左半面極點) 不保證系統穩定。
If you can’t solve a problem, then there is an easier problem you can solve: find it. -George Polya
3/28/2016
4/17/2015
[系統理論] 線性系統的 Input/Output to State Stability
回憶在線性系統理論中,我們說 系統為可觀測 (observable) 則可以設計觀察器(observer)。但若今天考慮的是 非線性系統,我們是否能有類似的準則來告訴我們何時可以設計觀察器? 或者說是否能提供非線性系統 類比於系統觀察性( observability) 的條件呢?
答案是肯定的,在非線性系統裡面 我們可用 Incremental Input/output-to-state stability (i-IOSS) 來界定系統是否可觀察。 不過如果是只針對線性系統,則我們僅需要 IOSS 即可等價 observability;以下為定義:
=======================
Definition: Input/output-to-state stability (IOSS)
假設非線性系統 $x^+ = f(x,w); \;\; y=h(x)$ 為 input/output-to-state stable (IOSS) 若下列條件成立:
對任意 $x_0 \in \mathbb{R}^n$ 與 $k \ge 0$,存在 $\beta(\cdot) \in \mathcal{KL}$ 與 $\gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$ 使得
\[
|x(k;x_0, {\bf w})| \le \beta(|x_0|,k) + \gamma_1(||{\bf w}||) + \gamma_2 (||{\bf y}||)
\]其中 $x(k;x_0,{\bf w})$ 為前述非線性系統 在時間 $k$ 與 初始條件 $x_0$ 輸入為 ${\bf w}$的解;另外 $||{\bf w}|| := \max_{j\ge 0} |w(j)|, ||{\bf y}|| := \max_{j\ge 0} |y(j)|$
=======================
那麼有了上述結果,我們應立即想到此定義對於原本線性系統是否有用? 現在我們看個例子:
Example
考慮離散時間 線性系統
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
y = Cx
\end{array}\]試證若系統為 observable,則 系統為 Input-Output State Stable (IOSS)
Proof:
回憶 IOSS 定義:
\[\left| {x\left( {k;{x_0}} \right)} \right| \le \beta \left( {|{x_0}|,k} \right) + {\gamma _1}\left( {||w||} \right) + {\gamma _2}\left( {||y||} \right)
\]其中 $\beta(\cdot) \in \mathcal{KL}$ 且 $\gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$
由於系統為 observable,我們可以設計觀察器,故我們可改寫系統方程如下
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
\Rightarrow {x^ + } = Ax + Gw + Ly - Ly\\
\Rightarrow {x^ + } = \left( {A - LC} \right)x + Gw + Ly
\end{array}\]其中 $ L$ 觀測器的增益矩陣, 且由於系統為 observable,故 $(A-LC)$ 為穩定矩陣;亦即 $eig(A-LC) < 1$ 。現在我們求解 $x(k)$ 如下:
\[\begin{array}{l}
\left| {x\left( k \right)} \right| = \left| {{{\left( {A - LC} \right)}^k}{x_0} + \sum\limits_{j = 0}^{k - 1} {{{\left( {A - LC} \right)}^{k - 1 - j}}\left( {Gw\left( j \right) + Ly\left( j \right)} \right)} } \right|\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le \left| {{{\left( {A - LC} \right)}^k}} \right|\left| {{x_0}} \right| + \sum\limits_{j = 0}^{k - 1} {\left| {{{\left( {A - LC} \right)}^{k - 1 - j}}Gw\left( j \right)} \right|} \\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}&{}
\end{array} + \sum\limits_{j = 0}^{k - 1} {\left| {{{\left( {A - LC} \right)}^{k - 1 - j}}Ly\left( j \right)} \right|}
\end{array}\]現在回憶下列結果 (Horn and Johnson, 1985, p.299):對 $c>0$,
\[\left| {{{\left( {A - LC} \right)}^k}} \right| \le c{\lambda ^k};\begin{array}{*{20}{c}}
{}&{}
\end{array}\mathop {\max }\limits_i \left| {ei{g_i}\left( A - LC \right)} \right| < \lambda < 1
\]故可知
\[\begin{array}{*{20}{l}}
{\left| {x\left( k \right)} \right| \le c{\lambda ^k}\left| {{x_0}} \right| + c{\lambda ^{k - 1}}\sum\limits_{j = 0}^{k - 1} {{\lambda ^{ - j}}\left| {Gw\left( j \right)} \right|} + c{\lambda ^{k - 1}}\sum\limits_{j = 0}^{k - 1} {{\lambda ^{ - j}}\left| {Lw\left( j \right)} \right|} }\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le c{\lambda ^k}\left| {{x_0}} \right| + c\left| G \right|\left\| w \right\|\frac{{1 - {\lambda ^k}}}{{1 - \lambda }} + c\left| L \right|\left\| y \right\|\frac{{1 - {\lambda ^k}}}{{1 - \lambda }}}\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le c{\lambda ^k}\left| {{x_0}} \right| + c\left| G \right|\left\| w \right\|\frac{1}{{1 - \lambda }} + c\left| L \right|\left\| y \right\|\frac{1}{{1 - \lambda }}}
\end{array}\]故我們可取
\[\left\{ \begin{array}{l}
\beta \left( {|{x_0}|,k} \right): = c{\lambda ^k}\left| {{x_0}} \right|\\
{\gamma _1}\left( {||w||} \right): = c\left| G \right|\left\| w \right\|\frac{{ {1 }}}{{1 - \lambda }}\\
{\gamma _2}\left( {||y||} \right){\rm{: = }}c\left| L \right|\left\| y \right\|\frac{{{1 }}}{{1 - \lambda }}
\end{array} \right.\]最後我們僅需檢驗 $\beta(\cdot) \in \mathcal{KL}$, 且 $ \gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$。 $\square$
事實上上述例子可以推廣成如下重要結果:
===================
Theorem: IOSS in linear system is equivalent to detectability
考慮離散時間 線性系統
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
y = Cx
\end{array}\]此系統為 detectable 若且為若 系統為 IOSS
===================
Proof: omitted
答案是肯定的,在非線性系統裡面 我們可用 Incremental Input/output-to-state stability (i-IOSS) 來界定系統是否可觀察。 不過如果是只針對線性系統,則我們僅需要 IOSS 即可等價 observability;以下為定義:
=======================
Definition: Input/output-to-state stability (IOSS)
假設非線性系統 $x^+ = f(x,w); \;\; y=h(x)$ 為 input/output-to-state stable (IOSS) 若下列條件成立:
對任意 $x_0 \in \mathbb{R}^n$ 與 $k \ge 0$,存在 $\beta(\cdot) \in \mathcal{KL}$ 與 $\gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$ 使得
\[
|x(k;x_0, {\bf w})| \le \beta(|x_0|,k) + \gamma_1(||{\bf w}||) + \gamma_2 (||{\bf y}||)
\]其中 $x(k;x_0,{\bf w})$ 為前述非線性系統 在時間 $k$ 與 初始條件 $x_0$ 輸入為 ${\bf w}$的解;另外 $||{\bf w}|| := \max_{j\ge 0} |w(j)|, ||{\bf y}|| := \max_{j\ge 0} |y(j)|$
=======================
那麼有了上述結果,我們應立即想到此定義對於原本線性系統是否有用? 現在我們看個例子:
Example
考慮離散時間 線性系統
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
y = Cx
\end{array}\]試證若系統為 observable,則 系統為 Input-Output State Stable (IOSS)
Proof:
回憶 IOSS 定義:
\[\left| {x\left( {k;{x_0}} \right)} \right| \le \beta \left( {|{x_0}|,k} \right) + {\gamma _1}\left( {||w||} \right) + {\gamma _2}\left( {||y||} \right)
\]其中 $\beta(\cdot) \in \mathcal{KL}$ 且 $\gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$
由於系統為 observable,我們可以設計觀察器,故我們可改寫系統方程如下
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
\Rightarrow {x^ + } = Ax + Gw + Ly - Ly\\
\Rightarrow {x^ + } = \left( {A - LC} \right)x + Gw + Ly
\end{array}\]其中 $ L$ 觀測器的增益矩陣, 且由於系統為 observable,故 $(A-LC)$ 為穩定矩陣;亦即 $eig(A-LC) < 1$ 。現在我們求解 $x(k)$ 如下:
\[\begin{array}{l}
\left| {x\left( k \right)} \right| = \left| {{{\left( {A - LC} \right)}^k}{x_0} + \sum\limits_{j = 0}^{k - 1} {{{\left( {A - LC} \right)}^{k - 1 - j}}\left( {Gw\left( j \right) + Ly\left( j \right)} \right)} } \right|\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le \left| {{{\left( {A - LC} \right)}^k}} \right|\left| {{x_0}} \right| + \sum\limits_{j = 0}^{k - 1} {\left| {{{\left( {A - LC} \right)}^{k - 1 - j}}Gw\left( j \right)} \right|} \\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}&{}
\end{array} + \sum\limits_{j = 0}^{k - 1} {\left| {{{\left( {A - LC} \right)}^{k - 1 - j}}Ly\left( j \right)} \right|}
\end{array}\]現在回憶下列結果 (Horn and Johnson, 1985, p.299):對 $c>0$,
\[\left| {{{\left( {A - LC} \right)}^k}} \right| \le c{\lambda ^k};\begin{array}{*{20}{c}}
{}&{}
\end{array}\mathop {\max }\limits_i \left| {ei{g_i}\left( A - LC \right)} \right| < \lambda < 1
\]故可知
\[\begin{array}{*{20}{l}}
{\left| {x\left( k \right)} \right| \le c{\lambda ^k}\left| {{x_0}} \right| + c{\lambda ^{k - 1}}\sum\limits_{j = 0}^{k - 1} {{\lambda ^{ - j}}\left| {Gw\left( j \right)} \right|} + c{\lambda ^{k - 1}}\sum\limits_{j = 0}^{k - 1} {{\lambda ^{ - j}}\left| {Lw\left( j \right)} \right|} }\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le c{\lambda ^k}\left| {{x_0}} \right| + c\left| G \right|\left\| w \right\|\frac{{1 - {\lambda ^k}}}{{1 - \lambda }} + c\left| L \right|\left\| y \right\|\frac{{1 - {\lambda ^k}}}{{1 - \lambda }}}\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le c{\lambda ^k}\left| {{x_0}} \right| + c\left| G \right|\left\| w \right\|\frac{1}{{1 - \lambda }} + c\left| L \right|\left\| y \right\|\frac{1}{{1 - \lambda }}}
\end{array}\]故我們可取
\[\left\{ \begin{array}{l}
\beta \left( {|{x_0}|,k} \right): = c{\lambda ^k}\left| {{x_0}} \right|\\
{\gamma _1}\left( {||w||} \right): = c\left| G \right|\left\| w \right\|\frac{{ {1 }}}{{1 - \lambda }}\\
{\gamma _2}\left( {||y||} \right){\rm{: = }}c\left| L \right|\left\| y \right\|\frac{{{1 }}}{{1 - \lambda }}
\end{array} \right.\]最後我們僅需檢驗 $\beta(\cdot) \in \mathcal{KL}$, 且 $ \gamma_1(\cdot), \gamma_2(\cdot) \in \mathcal{K}$。 $\square$
事實上上述例子可以推廣成如下重要結果:
===================
Theorem: IOSS in linear system is equivalent to detectability
考慮離散時間 線性系統
\[\begin{array}{l}
{x^ + } = Ax + Gw\\
y = Cx
\end{array}\]此系統為 detectable 若且為若 系統為 IOSS
===================
Proof: omitted
3/14/2015
[系統理論] 離散時間系統的穩定度理論 (1) - Lyapunov Stability Theory
延續前篇 [系統理論] 離散時間系統的穩定度理論 (0) - 先備概念,我們現在可以開始介紹 Lyapunov Stability Theory。
Definition: Lyapunov Function
一個函數 $V: \mathbb{R}^n \to \mathbb{R}_{\ge 0}$ 被稱作為 Lyapunov function for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$ 若下列條件成立:
存在函數 $\alpha_1(\cdot), \alpha_2(\cdot), \alpha_3(\cdot) \in \mathcal{K}_\infty$ 使得對任意 $x \in \mathbb{R}^n$,
===================
Definition: Lyapunov Function
一個函數 $V: \mathbb{R}^n \to \mathbb{R}_{\ge 0}$ 被稱作為 Lyapunov function for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$ 若下列條件成立:
存在函數 $\alpha_1(\cdot), \alpha_2(\cdot), \alpha_3(\cdot) \in \mathcal{K}_\infty$ 使得對任意 $x \in \mathbb{R}^n$,
- $V(x) \ge \alpha_1(|x|_\mathcal{A})$
- $V(x) \le \alpha_2(|x|_\mathcal{A})$
- $V(f(x)) - V(x) \le -\alpha_3(|x|_\mathcal{A})$
給定 $\mathcal{A}$ 為 closed positive invariant for $x^+ = f(x)$ 且 $\mathcal{A} \subset X$ 我們說函數 $V(\cdot)$ 為 Lyapunov function in $X$ for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$ 若下列條件成立:
對任意 $x \in X$,$V(\cdot)$ 滿足上述三條不等式。
上述 Lyapunov function 與 globally asymptotically stable 息息相關,事實上此Lyapunov function 的存在性為 globally asymptotically stable 的充分條件。我們將此記做下方結果
===================
Theorem 1: Existence of Lyapunov Function Implies Globally Asymptotically Stability
假設 $V(\cdot)$ 為 Lyapuonv function for $x^+ = f(x)$ 與 $\mathcal{A}$,則 $\mathcal{A}$ 為 globally asymptotically stable。
===================
Proof:
我們要證 $\mathcal{A}$ 為 globally asymptotically stable。故須證明
1. $\mathcal{A}$ 為 locally stable。
2. $\mathcal{A}$ 為 globally attractive。
先證 $\mathcal{A}$ 為 locally stable:給定 $\varepsilon >0$ 我們要找出 $\delta >0$ 使得對任意 $i \in \mathbb{Z}_{\ge 0}$ $|x|_\mathcal{A}< \delta \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $
由於 $V$ 為 Lyapunov function 故由其定義可繪製下圖幫助我們選擇 $\delta$
由於 $V$ 為 Lyapunov function 故由其定義可繪製下圖幫助我們選擇 $\delta$
令 $\delta : = \alpha _2^{ - 1}\left( {{\alpha _1}\left( \varepsilon \right)} \right)$;現在給定 $i \in \mathbb{Z}_{\ge 0}$, 我們要證明 $ |x|_\mathcal{A}< \delta \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $ ;故假設 $|x|_\mathcal{A}< \delta$ 則結合前述 $\delta$ 定義 我們有
\[{\left| x \right|_{{\cal A}}} < \delta = \alpha _2^{ - 1}\left( {{\alpha _1}\left( \varepsilon \right)} \right)\]故
\[\Rightarrow \alpha _2^{}\left( {{{\left| x \right|}_{{\cal A}}}} \right) < {\alpha _1}\left( \varepsilon \right)\]由Lyapunov function 定義第2條不等式可知
\[V(x) \le {\alpha _2}(|x{|_{{\cal A}}}) \Rightarrow V(x) \le {\alpha _1}\left( \varepsilon \right) \ \ \ \ (*)
\]現在觀察 Lyapunov function 定義第3條不等式,並且令 $\phi(i,x)$ 為 $x^+ = f(x)$ 之解,且注意到 $\alpha_i(\cdot)$ 其中 $i=1,2,3$ 皆為 $\mathcal{K}_\infty$ 函數,故我們可寫下
\[\begin{array}{*{20}{l}}
{V(f(x)) - V(x) \le - {\alpha _3}\left( {|x|} \right)}\\
{ \Rightarrow V(f(x)) \le V(x)}\\
{ \Rightarrow V(f(x)) \le V(x) \le {\alpha _1}\left( \varepsilon \right)\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}\left( * \right).}\\
{ \Rightarrow V(\phi \left( {i;x} \right)) \le {\alpha _1}\left( \varepsilon \right)}\\
{ \Rightarrow {\alpha _1}(|\phi \left( {i;x} \right){|_A}) \le V(\phi \left( {i;x} \right)) \le {\alpha _1}\left( \varepsilon \right)\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}1.}\\
{ \Rightarrow |\phi \left( {i;x} \right){|_A} \le \varepsilon }
\end{array}\]至此我們得到 $|x|_\mathcal{A}< \delta \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $ 即為所求。
接著我們證明 global attractivity:故給定任意 $x \in X$, 要證明 $|\phi(i;x)|_\mathcal{A} \to 0 \text{ as $i \to \infty$}$。基本想法為比較不同時間點 $\phi$。 現在給定 $\phi(i;x)$ 為 $x^+ = f(x)$ 之解,由 Lyapunov function 定義第3條不等式可知
\[\begin{array}{l}
V(f(x)) - V(x) \le - {\alpha _3}\left( {\left| x \right|} \right)\\
\Rightarrow V(\phi \left( {i + 1;x} \right)) - V(\phi \left( {i;x} \right)) \le - {\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)
\end{array}\]令 $V_{i+1}:= V(\phi \left( {i + 1;x} \right))$ 且 $V_i := V(\phi \left( {i;x} \right))$ 則由上式可推知 對任意 $x$ 而言, 數列 $\{V\}_i$ 為非遞增數列 且 有下界為 $0$,故可知 $V_i$ 收斂亦即
\[{V_{i + 1}} - {V_i} \le - {\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right) \to 0\begin{array}{*{20}{c}}
{}
\end{array}as\begin{array}{*{20}{c}}
{}
\end{array}i \to \infty \]故${\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right) \to 0$ 又由於 $\alpha_3 \in \mathcal{K}_\infty$,故
\[\begin{array}{l}
\left| {\phi \left( {i;x} \right)} \right| = \alpha _3^{ - 1}\underbrace {\left( {{\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)} \right)}_{ \to 0}\\
\Rightarrow \left| {\phi \left( {i;x} \right)} \right| = \alpha _3^{ - 1}\left( {{\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)} \right) \to 0\begin{array}{*{20}{c}}
{}&{}&{}
\end{array}since\begin{array}{*{20}{c}}
{}
\end{array}\alpha _3^{ - 1} \in {\mathcal{K}_\infty }
\end{array}\]至此證畢。 $\square$
上述定理告訴我們 asymptotically stable 的充分條件,但對於 必要條件 並無著墨。所幸透過適度的增強假設,我們仍可得到 asymptotically stable 必要條件,在此紀錄如下:
=============
=============
故我們將 Theorem 1 與 Theorem 2 整合可得如下充分必要條件:
=============
Theorem 3
若 $\mathcal{A}$ 為 compact 且 $f(\cdot)$ 為連續函數。則集合 $\mathcal{A}$ 為 globally asymptotic stable for the system $x^+ = f(x)$ 若且唯若 存在 平滑 (smooth) Lyapunov function for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$。
=============
\[{\left| x \right|_{{\cal A}}} < \delta = \alpha _2^{ - 1}\left( {{\alpha _1}\left( \varepsilon \right)} \right)\]故
\[\Rightarrow \alpha _2^{}\left( {{{\left| x \right|}_{{\cal A}}}} \right) < {\alpha _1}\left( \varepsilon \right)\]由Lyapunov function 定義第2條不等式可知
\[V(x) \le {\alpha _2}(|x{|_{{\cal A}}}) \Rightarrow V(x) \le {\alpha _1}\left( \varepsilon \right) \ \ \ \ (*)
\]現在觀察 Lyapunov function 定義第3條不等式,並且令 $\phi(i,x)$ 為 $x^+ = f(x)$ 之解,且注意到 $\alpha_i(\cdot)$ 其中 $i=1,2,3$ 皆為 $\mathcal{K}_\infty$ 函數,故我們可寫下
\[\begin{array}{*{20}{l}}
{V(f(x)) - V(x) \le - {\alpha _3}\left( {|x|} \right)}\\
{ \Rightarrow V(f(x)) \le V(x)}\\
{ \Rightarrow V(f(x)) \le V(x) \le {\alpha _1}\left( \varepsilon \right)\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}\left( * \right).}\\
{ \Rightarrow V(\phi \left( {i;x} \right)) \le {\alpha _1}\left( \varepsilon \right)}\\
{ \Rightarrow {\alpha _1}(|\phi \left( {i;x} \right){|_A}) \le V(\phi \left( {i;x} \right)) \le {\alpha _1}\left( \varepsilon \right)\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}1.}\\
{ \Rightarrow |\phi \left( {i;x} \right){|_A} \le \varepsilon }
\end{array}\]至此我們得到 $|x|_\mathcal{A}< \delta \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $ 即為所求。
接著我們證明 global attractivity:故給定任意 $x \in X$, 要證明 $|\phi(i;x)|_\mathcal{A} \to 0 \text{ as $i \to \infty$}$。基本想法為比較不同時間點 $\phi$。 現在給定 $\phi(i;x)$ 為 $x^+ = f(x)$ 之解,由 Lyapunov function 定義第3條不等式可知
\[\begin{array}{l}
V(f(x)) - V(x) \le - {\alpha _3}\left( {\left| x \right|} \right)\\
\Rightarrow V(\phi \left( {i + 1;x} \right)) - V(\phi \left( {i;x} \right)) \le - {\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)
\end{array}\]令 $V_{i+1}:= V(\phi \left( {i + 1;x} \right))$ 且 $V_i := V(\phi \left( {i;x} \right))$ 則由上式可推知 對任意 $x$ 而言, 數列 $\{V\}_i$ 為非遞增數列 且 有下界為 $0$,故可知 $V_i$ 收斂亦即
\[{V_{i + 1}} - {V_i} \le - {\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right) \to 0\begin{array}{*{20}{c}}
{}
\end{array}as\begin{array}{*{20}{c}}
{}
\end{array}i \to \infty \]故${\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right) \to 0$ 又由於 $\alpha_3 \in \mathcal{K}_\infty$,故
\[\begin{array}{l}
\left| {\phi \left( {i;x} \right)} \right| = \alpha _3^{ - 1}\underbrace {\left( {{\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)} \right)}_{ \to 0}\\
\Rightarrow \left| {\phi \left( {i;x} \right)} \right| = \alpha _3^{ - 1}\left( {{\alpha _3}\left( {\left| {\phi \left( {i;x} \right)} \right|} \right)} \right) \to 0\begin{array}{*{20}{c}}
{}&{}&{}
\end{array}since\begin{array}{*{20}{c}}
{}
\end{array}\alpha _3^{ - 1} \in {\mathcal{K}_\infty }
\end{array}\]至此證畢。 $\square$
上述定理告訴我們 asymptotically stable 的充分條件,但對於 必要條件 並無著墨。所幸透過適度的增強假設,我們仍可得到 asymptotically stable 必要條件,在此紀錄如下:
=============
Theorem 2: Converse Theorem for Asymptotic Stability
令 $\mathcal{A}$ 為 compact 且 $f(\cdot)$ 為連續函數。假設 $\mathcal{A}$ 為 globally asymptotic stable for the system $x^+ = f(x)$ 則 存在 平滑 (smooth) Lyapunov function for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$。=============
Proof: omitted
=============
Theorem 3
若 $\mathcal{A}$ 為 compact 且 $f(\cdot)$ 為連續函數。則集合 $\mathcal{A}$ 為 globally asymptotic stable for the system $x^+ = f(x)$ 若且唯若 存在 平滑 (smooth) Lyapunov function for system $x^+ = f(x)$ 與 集合 $\mathcal{A}$。
=============
[系統理論] 離散時間系統的穩定度理論 (0) - 先備概念
穩定度理論可追朔至 Aleksandr Lyapunov在 1892 出版的 The General Problem of Stability of Motion 提出,主要是透過建構 Lyapunov 函數 來判別動態系統是否穩定。以下討論我們將以 離散時間 非線性動態系統為主。
現在考慮以下 離散時間 非線性動態系統
\[
x^+ = f(x,u)
\]其中 $x \in \mathbb{R}^n$ 為當前系統狀態 且 $u \in \mathbb{R}^m$ 為當前的控制力;$x^+$ 為下個時刻的系統狀態。且假設 $f: \mathbb{R}^n \times \mathbb{R}^m \to \mathbb{R}^n$ 為連續函數。
定義 $\phi(k; x, {\bf u}) $為在時刻 $k$,對於動態系統 $x^+ = f(x,u)$ 的解 (初始值為 $x(0)=x$ ; 控制力序列 $\bf u$ $:=\{u(0), u(1), ...\}$)
若 控制律 $u := \kappa (x)$ 決定,則系統閉迴路可表為
\[
x^+ = f(x,\kappa(x)):=f_c(x)
\]注意到 $\kappa(\cdot)$ 不一定為連續函數,此時對應的 $f(x, \kappa(\cdot))$ 亦不一定為連續。對此不連續的情況我們額外假設 $f_c(\cdot)$ 為 局部有界(locally bounded)。
目標:我們希望 控制系統 要"穩定"。
在此所謂的穩定 意指 控制系統對於 初始狀態 的小擾動 不會 導致 閉迴路系統響應 大幅度擾動 且 系統狀態能夠收斂到指定的狀態 或者 收斂到指定的 狀態集合 (此情況多半發生在有外部干擾的時候)。
以下我們會針對定義 系統的 穩定度 與 漸進穩定度;在介紹之前我們需要先定義一些名詞:首先是 如何指出系統狀態的收斂
============
Definition: Equilibrium Point or Steady-State
狀態 $x^*$ 被稱作 $x^+ = f(x)$ 的 平衡點(equilibrium point) 若 $$x(0) = x^* \Rightarrow x(k) = \phi(k;x^*) = x^*, \;\; \forall k \ge 0$$
============
Comment:
1. 上述定義表示 $x^*$ 為 平衡點 若其滿足 $x^* = f(x^*)$
2. equilibrium point 為 被隔離的(isolated) 若在 $x^*$ 附近沒有其他的平衡點。
3. 非線性系統可能有多個 被隔離的平衡點
Example: Equilibrium Point of Linear System
考慮離散時間線性系統
\[
x^+ = Ax +b
\]具有平衡點 $x^*$ 則
\[\begin{array}{l}
{x^ + } = Ax + b\
\Rightarrow {x^*} = A{x^*} + b\\
\Rightarrow \left( {I - A} \right){x^*} = b
\end{array}\]若 $I-A$ 反矩陣存在,則我們說 此線性系統有 unique (isolated) 平衡點
\[{x^*} = {\left( {I - A} \right)^{ - 1}}b\]若 $I-A$ 反矩陣不存在,則我們說此線性系統有 連續統 (continuum) $\{x: (I-A) x=b\}$ 的平衡點。
若我們考慮 震盪系統 的穩定度,則此時不再是討論 是否收斂到某個狀態 (平衡點);而是討論收斂到某個集合。以下我們給出此類集合所需的定義:
一個集合 $\mathcal{A}$ 稱作 positive invariant for system $x^+ = f(x)$ 若下列條件成立:
\[
x \in A \Rightarrow f(x) \in \mathcal{A}
\]=============
一個函數 $g: \mathbb{R}_{\ge 0} \to \mathbb{R}_{\ge 0}$ 為 $\mathcal{K}$ 類函數若下列條件滿足:
我們說 一個函數 $g: \mathbb{R}_{\ge 0} \to \mathbb{R}_{\ge 0}$ 為 $\mathcal{K}_\infty$ 類函數若下列條件滿足:
FACT 2:
若 $\alpha_1(\cdot)$ 與 $\alpha_2(\cdot)$ 為 $\mathcal{K}$ 類函數 且 $\beta(\cdot)$ 為 $\mathcal{KL}$ 函數,則 $\sigma (r,s): = {\alpha _1}(\beta \left( {{\alpha _2}\left( r \right)} \right),s)$ 為 $\mathcal{KL}$函數。
現在考慮以下 離散時間 非線性動態系統
\[
x^+ = f(x,u)
\]其中 $x \in \mathbb{R}^n$ 為當前系統狀態 且 $u \in \mathbb{R}^m$ 為當前的控制力;$x^+$ 為下個時刻的系統狀態。且假設 $f: \mathbb{R}^n \times \mathbb{R}^m \to \mathbb{R}^n$ 為連續函數。
定義 $\phi(k; x, {\bf u}) $為在時刻 $k$,對於動態系統 $x^+ = f(x,u)$ 的解 (初始值為 $x(0)=x$ ; 控制力序列 $\bf u$ $:=\{u(0), u(1), ...\}$)
若 控制律 $u := \kappa (x)$ 決定,則系統閉迴路可表為
\[
x^+ = f(x,\kappa(x)):=f_c(x)
\]注意到 $\kappa(\cdot)$ 不一定為連續函數,此時對應的 $f(x, \kappa(\cdot))$ 亦不一定為連續。對此不連續的情況我們額外假設 $f_c(\cdot)$ 為 局部有界(locally bounded)。
目標:我們希望 控制系統 要"穩定"。
在此所謂的穩定 意指 控制系統對於 初始狀態 的小擾動 不會 導致 閉迴路系統響應 大幅度擾動 且 系統狀態能夠收斂到指定的狀態 或者 收斂到指定的 狀態集合 (此情況多半發生在有外部干擾的時候)。
以下我們會針對定義 系統的 穩定度 與 漸進穩定度;在介紹之前我們需要先定義一些名詞:首先是 如何指出系統狀態的收斂
============
Definition: Equilibrium Point or Steady-State
狀態 $x^*$ 被稱作 $x^+ = f(x)$ 的 平衡點(equilibrium point) 若 $$x(0) = x^* \Rightarrow x(k) = \phi(k;x^*) = x^*, \;\; \forall k \ge 0$$
============
1. 上述定義表示 $x^*$ 為 平衡點 若其滿足 $x^* = f(x^*)$
2. equilibrium point 為 被隔離的(isolated) 若在 $x^*$ 附近沒有其他的平衡點。
3. 非線性系統可能有多個 被隔離的平衡點
Example: Equilibrium Point of Linear System
考慮離散時間線性系統
\[
x^+ = Ax +b
\]具有平衡點 $x^*$ 則
\[\begin{array}{l}
{x^ + } = Ax + b\
\Rightarrow {x^*} = A{x^*} + b\\
\Rightarrow \left( {I - A} \right){x^*} = b
\end{array}\]若 $I-A$ 反矩陣存在,則我們說 此線性系統有 unique (isolated) 平衡點
\[{x^*} = {\left( {I - A} \right)^{ - 1}}b\]若 $I-A$ 反矩陣不存在,則我們說此線性系統有 連續統 (continuum) $\{x: (I-A) x=b\}$ 的平衡點。
若我們考慮 震盪系統 的穩定度,則此時不再是討論 是否收斂到某個狀態 (平衡點);而是討論收斂到某個集合。以下我們給出此類集合所需的定義:
=============
Definition: Positive Invariant Set一個集合 $\mathcal{A}$ 稱作 positive invariant for system $x^+ = f(x)$ 若下列條件成立:
\[
x \in A \Rightarrow f(x) \in \mathcal{A}
\]=============
Comment:
1. Positive 來自於 $x^+ = f(x)$ 為動態系統隨時間 $k$ "增加" 而持續變動。
2. 考慮 closed set $\mathcal{A}:=\{x^*\}$ 且 $x^*$ 為系統 $x^+ = f(x)$ 的平衡點,則
2. 考慮 closed set $\mathcal{A}:=\{x^*\}$ 且 $x^*$ 為系統 $x^+ = f(x)$ 的平衡點,則
\[
x \in \mathcal{A}\;\; (\text{since} \;x^* \in \mathcal{A}) \Rightarrow f(x) \in \mathcal{A} \;\;(\text{since} \;f(x) = x^*)
\]
x \in \mathcal{A}\;\; (\text{since} \;x^* \in \mathcal{A}) \Rightarrow f(x) \in \mathcal{A} \;\;(\text{since} \;f(x) = x^*)
\]
=============
Definition: K, K infinity, KL function一個函數 $g: \mathbb{R}_{\ge 0} \to \mathbb{R}_{\ge 0}$ 為 $\mathcal{K}$ 類函數若下列條件滿足:
- $g$ 為連續
- $g(0) = 0$
- 嚴格遞增(strictly increasing);亦即 $\forall x,y$,$y > x \Rightarrow g(y) > g(x)$
我們說 一個函數 $g: \mathbb{R}_{\ge 0} \to \mathbb{R}_{\ge 0}$ 為 $\mathcal{K}_\infty$ 類函數若下列條件滿足:
- $g$ 為 $\mathcal{K}$ 類函數
- 當 $t \to \infty$,$g(t) \to \infty$
我們說一個函數 $h: \mathbb{R}_{\ge 0} \times \mathbb{Z}_{\ge 0} \to \mathbb{R}_{\ge 0}$ 為 $\mathcal{KL}$ 類函數若下列條件滿足:
- 對任意 $t \ge 0$,$h(\cdot, t)$ 為 $\mathcal{K}$ 類函數
- 對任意 $s \ge 0$,$h(s, \cdot)$ 為非遞增(nonincreasing) 且 滿足 $\lim_{t\to \infty} h(s,t) =0$
=============
Example
1. $g(x) := x$ 為 $\mathcal{K}$類函數 (亦為 $\mathcal{K}_\infty $ 函數)
2. $erf(x)$ 為 $\mathcal{K}$類函數
以下我們將前述 $\mathcal{K}$類函數的重要性質:
=============
FACT 1: Inverse K function is a K function
若 $\alpha_1(\cdot), \alpha_2(\cdot)$ 為 $\mathcal{K}$ 類函數 (或者 $\mathcal{K}_\infty$ 函數),則其反函數 $\alpha_1^{-1}(\cdot), \alpha_1^{-1}(\cdot)$ 亦仍為 $\mathcal{K}$ 類函數 (或者 $\mathcal{K}_\infty$ 函數)
若 $\alpha_1(\cdot), \alpha_2(\cdot)$ 為 $\mathcal{K}$ 類函數 (或者 $\mathcal{K}_\infty$ 函數),則其反函數 $\alpha_1^{-1}(\cdot), \alpha_1^{-1}(\cdot)$ 亦仍為 $\mathcal{K}$ 類函數 (或者 $\mathcal{K}_\infty$ 函數)
=============
Proof: omitted
=============
若 $\alpha_1(\cdot)$ 與 $\alpha_2(\cdot)$ 為 $\mathcal{K}$ 類函數 且 $\beta(\cdot)$ 為 $\mathcal{KL}$ 函數,則 $\sigma (r,s): = {\alpha _1}(\beta \left( {{\alpha _2}\left( r \right)} \right),s)$ 為 $\mathcal{KL}$函數。
=============
Proof: omitted
有了以上定義我們可以開始引入 穩定度 的嚴格定義。以下我們考慮 $x^+ = f(x)$ 且假設 $f(\cdot)$ 為 局部有界(locally bounded) 且集合 $A$ 為 closed 與 positive invariant 。
==================
Definition: Local Stability (Stability in Lyapunov Sense)
給定 closed positive invariant 集合 $\mathcal{A}$ 。我們稱 此集合 $\mathcal{A}$ 為 locally stable for $x^+ = f(x)$ 若下列條件成立:
對任意 $\varepsilon>0$ 存在 $\delta >0$ 使得對任意 $i \in Z_{\ge 0}$, $|x|_\mathcal{A} < \delta \Rightarrow |\phi(i; x)|_\mathcal{A} < \varepsilon$
其中 $|x|_\mathcal{A} := \inf_{z \in \mathcal{A}} |x - z|$
有了以上定義我們可以開始引入 穩定度 的嚴格定義。以下我們考慮 $x^+ = f(x)$ 且假設 $f(\cdot)$ 為 局部有界(locally bounded) 且集合 $A$ 為 closed 與 positive invariant 。
==================
Definition: Local Stability (Stability in Lyapunov Sense)
給定 closed positive invariant 集合 $\mathcal{A}$ 。我們稱 此集合 $\mathcal{A}$ 為 locally stable for $x^+ = f(x)$ 若下列條件成立:
對任意 $\varepsilon>0$ 存在 $\delta >0$ 使得對任意 $i \in Z_{\ge 0}$, $|x|_\mathcal{A} < \delta \Rightarrow |\phi(i; x)|_\mathcal{A} < \varepsilon$
其中 $|x|_\mathcal{A} := \inf_{z \in \mathcal{A}} |x - z|$
==================
Example:
考慮 $A:= \{0\}$ 則 Local Stability 可由下圖得知
上圖顯示了若給定任意初始位置 $x$ 且此 $x$ 與原點 $A:=\{0\}$ 距離落在 開球 $B_{\delta}$ 之中,且若系統 $x^+ = f(x)$ 隨時間變化演進,其解 $\phi(i,x)$ 到原點距離 $A=\{0\}$ 持續落在另一開球 $B_\varepsilon$之中,故此系統稱為 Local stable。
======================
Definition: Global Attraction
給定 closed positive invariant 集合 $\mathcal{A}$ 。我們說此集合 $A$ 為 globally attractive for system $x^+ = f(x)$ 若下列條件成立:
\[
|\phi(i;x)|_\mathcal{A} \to 0 \text{ as $i \to \infty$} \;\; \forall x\in \mathbb{R}^n
\]======================
======================
Comment:
考慮 $\mathcal{A}:=\{0\}$,有可能 globally attractive 但並非 locally stable。比如說考慮\[
x^+ = Ax + \phi(x)
\]其中 $A$ 有 eigenvalue $\lambda_1 = 0.5$ 與 $\lambda_2 = 2$ 且對應的 eigenvector 為 $w_1, w_2$且 $\phi(\cdot)$為 平滑函數 滿足 $\phi(0) = 0$ 與 ${\left. {\frac{\partial }{{\partial x}}\phi (x)} \right|_{x = 0}} = 0$
故在 $0$ 附近,$x^+ = Ax + \phi(x)$ 行為將會非常接近 $x^+ = Ax$ ;故若 $\phi(x) =0$ 則 特徵向量$w_1$ 因為具有特徵值 $\lambda_1 = 0.5$ (落在 unit circle 之中)故此特徵向量會迫使狀態收斂到 $0$點,但 特徵向量 $w_2$ 具有不穩定的特徵值 $\lambda_2 = 2$ 故此特徵向量會迫使狀態發散。故總和此兩者,可知儘管有 globally attractive 但卻沒有 stable origin ($\mathcal{A}:=\{0\}$無法滿足 local stability 定義)
以下我們將相關的穩定度定義總結如下:
=============================
Definition: Stability without constraint
給定 closed positive invariant 集合 $\mathcal{A}$ 為
以下結果將前述穩定度定義 與 KL 函數做連結:
=============================
FACT: (Globally Asymptotic Stable and KL function)
令集合 $\mathcal{A}$ 為 compact 且 positive invariant; $f(\cdot)$ 為連續函數。則 $\mathcal{A}$ 為 globally asymptotic stable for $x^+ = f(x)$ 若且唯若 存在 $\mathcal{KL}$ 函數 $\beta(\cdot)$ 使得 對任意 $x \in \mathbb{R}^n$,
\[
|\phi(i;x)|_\mathcal{A} \le \beta(|x|_\mathcal{A},i)\;\; \forall i \in \mathbb{Z}_{\ge 0}
\]=============================
另外,實際上若考慮系統狀態有拘束的情形,則 globally asymptotic stability 並不保證能夠達成,此時我們需要再次拓展前述定義來滿足有拘束的情況:
=============================
Definition: Stability with Constraint Set X
假設狀態拘束集合 $X \subset \mathbb{R}^n$ 為 positive invariant for $x^+ = f(x)$ 且集合 $\mathcal{A}$ closed positive invariant for $x^+ = f(x)$ 且 $\mathcal{A} \subset int(X)$ ( $int(X) :=$ interior of $X$) 則我們說集合 $\mathcal{A}$ 為
延伸閱讀
[系統理論] 離散時間系統的穩定度理論 (1) - Lyapunov Stability Theory
ref: J. B. Rawlings and D. Q. Mayne, "Model Predictive Control: Theory and Design", 2009
Example:
考慮 $A:= \{0\}$ 則 Local Stability 可由下圖得知
上圖顯示了若給定任意初始位置 $x$ 且此 $x$ 與原點 $A:=\{0\}$ 距離落在 開球 $B_{\delta}$ 之中,且若系統 $x^+ = f(x)$ 隨時間變化演進,其解 $\phi(i,x)$ 到原點距離 $A=\{0\}$ 持續落在另一開球 $B_\varepsilon$之中,故此系統稱為 Local stable。
======================
Definition: Global Attraction
給定 closed positive invariant 集合 $\mathcal{A}$ 。我們說此集合 $A$ 為 globally attractive for system $x^+ = f(x)$ 若下列條件成立:
\[
|\phi(i;x)|_\mathcal{A} \to 0 \text{ as $i \to \infty$} \;\; \forall x\in \mathbb{R}^n
\]======================
======================
Definition: (Global Asymptotic Stability (GAS))
給定 closed positive invariant 集合 $\mathcal{A}$ 為 globally asymptotically stable for system $x^+ = f(x)$ 若下列條件成立:
$\mathcal{A}$ 為 locally stable 且 globally attractive======================
Comment:
考慮 $\mathcal{A}:=\{0\}$,有可能 globally attractive 但並非 locally stable。比如說考慮\[
x^+ = Ax + \phi(x)
\]其中 $A$ 有 eigenvalue $\lambda_1 = 0.5$ 與 $\lambda_2 = 2$ 且對應的 eigenvector 為 $w_1, w_2$且 $\phi(\cdot)$為 平滑函數 滿足 $\phi(0) = 0$ 與 ${\left. {\frac{\partial }{{\partial x}}\phi (x)} \right|_{x = 0}} = 0$
故在 $0$ 附近,$x^+ = Ax + \phi(x)$ 行為將會非常接近 $x^+ = Ax$ ;故若 $\phi(x) =0$ 則 特徵向量$w_1$ 因為具有特徵值 $\lambda_1 = 0.5$ (落在 unit circle 之中)故此特徵向量會迫使狀態收斂到 $0$點,但 特徵向量 $w_2$ 具有不穩定的特徵值 $\lambda_2 = 2$ 故此特徵向量會迫使狀態發散。故總和此兩者,可知儘管有 globally attractive 但卻沒有 stable origin ($\mathcal{A}:=\{0\}$無法滿足 local stability 定義)
以下我們將相關的穩定度定義總結如下:
=============================
Definition: Stability without constraint
給定 closed positive invariant 集合 $\mathcal{A}$ 為
- locally stable 若 對任意 $\varepsilon >0$ 存在 $\delta >0$ 使得對任意 $i \in \mathbb{Z}_{\ge 0}$ $|x|_\mathcal{A} < \delta \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $
- unstable 若 其 不為 locally stable
- locally attractive 若 存在 $\eta >0$ 使得 $|x|_\mathcal{A} < \eta \Rightarrow |\phi(i;x)|_\mathcal{A} \to 0\;\; \text{as $i \to \infty$} $
- globally attractive 若對任意 $x \in \mathbb{R}^n$, $|\phi(i;x)|_\mathcal{A} \to 0\;\; \text{as $i \to \infty$} $
- locally asymptotically stable 若其為 locally stable 與 locally attractive
- globally asymptotically stable 若其為 locally stable 與 globally attractive
- locally exponentially stable 若 存在 $\eta >0, c>0$ 與 $\gamma \in (0,1)$ 使得 對任意 $i \in \mathbb{Z}_{\ge 0}$ 而言, $|x|_\mathcal{A} < \eta \Rightarrow |\phi(i;x)|_{\mathcal{A}} \le c |x|_\mathcal{A} \gamma^i$
- globally exponentially stable 若 存在 $c>0$ 與 $\gamma \in (0,1)$ 使得 對任意 $i \in \mathbb{Z}_{\ge 0}$ 而言, $|\phi(i;x)|_{\mathcal{A}} \le c |x|_\mathcal{A} \gamma^i$
=============================
FACT: (Globally Asymptotic Stable and KL function)
令集合 $\mathcal{A}$ 為 compact 且 positive invariant; $f(\cdot)$ 為連續函數。則 $\mathcal{A}$ 為 globally asymptotic stable for $x^+ = f(x)$ 若且唯若 存在 $\mathcal{KL}$ 函數 $\beta(\cdot)$ 使得 對任意 $x \in \mathbb{R}^n$,
\[
|\phi(i;x)|_\mathcal{A} \le \beta(|x|_\mathcal{A},i)\;\; \forall i \in \mathbb{Z}_{\ge 0}
\]=============================
另外,實際上若考慮系統狀態有拘束的情形,則 globally asymptotic stability 並不保證能夠達成,此時我們需要再次拓展前述定義來滿足有拘束的情況:
=============================
Definition: Stability with Constraint Set X
假設狀態拘束集合 $X \subset \mathbb{R}^n$ 為 positive invariant for $x^+ = f(x)$ 且集合 $\mathcal{A}$ closed positive invariant for $x^+ = f(x)$ 且 $\mathcal{A} \subset int(X)$ ( $int(X) :=$ interior of $X$) 則我們說集合 $\mathcal{A}$ 為
- locally stable in $X$ 若 對任意 $\varepsilon >0$ 存在 $\delta >0$ 使得對任意 $i \in \mathbb{Z}_{\ge 0}$ $x \in X \cap (\mathcal{A} \oplus B_\delta) \Rightarrow |\phi(i;x)|_\mathcal{A} <\varepsilon $
- locally attractive in $X$ 若 存在 $\eta >0$ 使得 $x \in X \cap (\mathcal{A} \oplus B_\delta) \Rightarrow |\phi(i;x)|_\mathcal{A} \to 0\;\; \text{as $i \to \infty$} $
- attractive in $X$ 若 $ |\phi(i;x)|_\mathcal{A} \to 0\;\; \text{as $i \to \infty$} \; \forall x \in X$
- locally asymptotically stable in $X$ 若其為 locally stable in $X$ 與 locally attractive in $X$
- asymptotically stable with region of attraction $X$ 若其為 locally stable in $X$ 與 attractive in $X$。
- locally exponentially stable with region of attraction $X$ 若 存在 $\eta >0, c>0$ 與 $\gamma \in (0,1)$ 使得 對任意 $i \in \mathbb{Z}_{\ge 0}$ 而言, $x \in X \cap (\mathcal{A} \oplus B_\eta) \Rightarrow |\phi(i;x)|_{\mathcal{A}} \le c |x|_\mathcal{A} \gamma^i$
- globally exponentially stable with region of attraction $X$ 若 存在 $c>0$ 與 $\gamma \in (0,1)$ 使得 對任意 $i \in \mathbb{Z}_{\ge 0}$ 而言, $|\phi(i;x)|_{\mathcal{A}} \le c |x|_\mathcal{A} \gamma^i$
[系統理論] 離散時間系統的穩定度理論 (1) - Lyapunov Stability Theory
ref: J. B. Rawlings and D. Q. Mayne, "Model Predictive Control: Theory and Design", 2009
2/15/2015
[線性系統] Hautus Lemma 與 控制性/可穩定性質
以下我們介紹 線性系統理論中關於 控制性的 重要結果
==========================
Lemma: Hautus Lemma for Controllability
我們稱一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\] 為 controllable 或稱 (A, B) controllable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall \lambda \in \mathbb{C}
\]其中 $\mathbb{C}$ 表示 任意 complex number 所形成的集合。
==========================
Comments:
1. 上述 Lemma 等價為 矩陣 $[\lambda I - A\;\; B]$ 有 $n$ 個 independent rows (full row rank) 。
2. 也許讀者會好奇為何需要如此多 控制性 檢驗工具? 為什麼不使用 可控性矩陣(controllability matrix) 檢驗法就好? 事實上此 Hautus Lemma 主要是功用是大幅簡化 理論證明,但一般實際 檢驗 系統的 可控性 仍多仰賴 可控性矩陣(controllability matrix) 檢驗法。
3. 注意到上述條件需要檢驗 "任意" complex number $\lambda$ 此條件明顯過於嚴苛。不過我們可以注意到 若 $\lambda $ 並非為 $A$ 矩陣的特徵值,則 $rank[\lambda I - A\;\; B] =n$ 必然成立,故我們只需檢驗 $\lambda$ 為 $A$ 矩陣的特徵值部分即可。故
==========================
Lemma (Modified): Hautus Lemma for Controllability
一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\]為 controllable 或稱 (A,B) controllable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall \lambda \in eig(A)
\]==========================
以下我們將討論拓展到 stabilizability。若現在我們將原本系統 $x(k+1) = A x(k) + Bu(k)$ 透過similar transformation (關於相似轉換細節請參閱 [線性系統] 控制性矩陣 與 非奇異轉換 (Controllability matrix & Non-singular transformation)) 轉成以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable。上式又稱為 controllability canonical form。注意到若我們觀察此系統的 contorllability matrix
\[C = \left[ {\begin{array}{*{20}{c}}
{{B_1}}&{{A_{11}}{B_1}}&{{A_{11}}^2{B_1}}& \cdots &{{A_{11}}^n{B_1}}\\
0&0&0& \cdots &0
\end{array}} \right]\]由於 $(A_{11}, B_1)$ 為 controllable 故 controllability matrix $C$ 上排具有 $n_1$ 個 independent row。但是 $C$ 的 下排 $n_2$ rows 均為 $0$ ,故必定不滿足 full row rank test,此系統 uncontrollable。
Exercise: 試證 uncontrollable mode 為 $x_2(k)$。
儘管有 uncontrollable mode ,但我們可以退而求其次,若此 uncontrollable mode 為 stable,則我們仍可控制此系統,此類系統稱作 stabilizable。
===========
Definition: Stabilizability
考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable。若 $A_{22}$ 為 stable 則此 partitioned system 稱作 stabilizable。=========
接著我們可以拓展前述討論的 Hautus Lemma 到 Stabilizability 之中。
================
Lemma: (Hautus Lemma for Stabilizability)
一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\] 為 stabilizable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1
\]================
Proof:
$(\Rightarrow)$ 假設系統 stabilizable,我們要證明 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $成立。
注意到 系統 stabilizable,故由 stabilizability 定義可知
考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable 且 $A_{22}$ 為 stable 。故我們有
\[rank[\lambda I - A\;\;B] = rank\left[ {\begin{array}{*{20}{c}}
{\lambda I - {A_{11}}}&{ - {A_{12}}}&{{B_1}}\\
0&{\lambda I - {A_{22}}}&0
\end{array}} \right] \ \ \ \ \ (*)
\] 且 若我們觀察 矩陣 $[\lambda I - A_{11}\;\; B_1]$ 與 $[\lambda I - A_{22}]$ 的 row,可發現若 $|\lambda| \ge 1$ 則這些 rows 互為 independent。故由 Hautus Lemma for controllability 可知 ,對 $|\lambda| \ge 1$而言,$(*)$ 的 rows 為 independent 故 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $
$(\Leftarrow)$ 假設 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $成立,我們要證明 系統 stabilizable 。亦即 考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable 且 $A_{22}$ 為 stable 注意 partitioned system 為 controllability canonical form,故 $(A_{11}, B_1)$ 已為 controllable ,故我們僅須證明 $A_{22}$ 為 stable 。
由 假設 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $ 我們可知 對任意 $|\lambda| \ge 1 $,
\[rank[\lambda I - A\;\;B] = rank\left[ {\begin{array}{*{20}{c}}
{\lambda I - {A_{11}}}&{ - {A_{12}}}&{{B_1}}\\
0&{\lambda I - {A_{22}}}&0
\end{array}} \right]\]具有 independent rows 。此暗示了 上述矩陣下排 $[\lambda I - A_{22} ]$ 亦有 full row rank $\forall |\lambda| \ge 1$ 故 $A_{22}$ 的 eigenvalue 必 $<1$ 故 $A_{22} $ 為 stable。
==========================
Lemma: Hautus Lemma for Controllability
我們稱一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\] 為 controllable 或稱 (A, B) controllable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall \lambda \in \mathbb{C}
\]其中 $\mathbb{C}$ 表示 任意 complex number 所形成的集合。
==========================
Proof. omitted.
1. 上述 Lemma 等價為 矩陣 $[\lambda I - A\;\; B]$ 有 $n$ 個 independent rows (full row rank) 。
2. 也許讀者會好奇為何需要如此多 控制性 檢驗工具? 為什麼不使用 可控性矩陣(controllability matrix) 檢驗法就好? 事實上此 Hautus Lemma 主要是功用是大幅簡化 理論證明,但一般實際 檢驗 系統的 可控性 仍多仰賴 可控性矩陣(controllability matrix) 檢驗法。
3. 注意到上述條件需要檢驗 "任意" complex number $\lambda$ 此條件明顯過於嚴苛。不過我們可以注意到 若 $\lambda $ 並非為 $A$ 矩陣的特徵值,則 $rank[\lambda I - A\;\; B] =n$ 必然成立,故我們只需檢驗 $\lambda$ 為 $A$ 矩陣的特徵值部分即可。故
==========================
Lemma (Modified): Hautus Lemma for Controllability
一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\]為 controllable 或稱 (A,B) controllable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall \lambda \in eig(A)
\]==========================
Proof: omitted.
以下我們將討論拓展到 stabilizability。若現在我們將原本系統 $x(k+1) = A x(k) + Bu(k)$ 透過similar transformation (關於相似轉換細節請參閱 [線性系統] 控制性矩陣 與 非奇異轉換 (Controllability matrix & Non-singular transformation)) 轉成以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable。上式又稱為 controllability canonical form。注意到若我們觀察此系統的 contorllability matrix
\[C = \left[ {\begin{array}{*{20}{c}}
{{B_1}}&{{A_{11}}{B_1}}&{{A_{11}}^2{B_1}}& \cdots &{{A_{11}}^n{B_1}}\\
0&0&0& \cdots &0
\end{array}} \right]\]由於 $(A_{11}, B_1)$ 為 controllable 故 controllability matrix $C$ 上排具有 $n_1$ 個 independent row。但是 $C$ 的 下排 $n_2$ rows 均為 $0$ ,故必定不滿足 full row rank test,此系統 uncontrollable。
Exercise: 試證 uncontrollable mode 為 $x_2(k)$。
儘管有 uncontrollable mode ,但我們可以退而求其次,若此 uncontrollable mode 為 stable,則我們仍可控制此系統,此類系統稱作 stabilizable。
===========
Definition: Stabilizability
考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable。若 $A_{22}$ 為 stable 則此 partitioned system 稱作 stabilizable。=========
接著我們可以拓展前述討論的 Hautus Lemma 到 Stabilizability 之中。
================
Lemma: (Hautus Lemma for Stabilizability)
一個離散線性系統
\[
x(k+1) = A x(k) + Bu(k)
\] 為 stabilizable 若且唯若
\[
rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1
\]================
Proof:
$(\Rightarrow)$ 假設系統 stabilizable,我們要證明 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $成立。
注意到 系統 stabilizable,故由 stabilizability 定義可知
考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable 且 $A_{22}$ 為 stable 。故我們有
\[rank[\lambda I - A\;\;B] = rank\left[ {\begin{array}{*{20}{c}}
{\lambda I - {A_{11}}}&{ - {A_{12}}}&{{B_1}}\\
0&{\lambda I - {A_{22}}}&0
\end{array}} \right] \ \ \ \ \ (*)
\] 且 若我們觀察 矩陣 $[\lambda I - A_{11}\;\; B_1]$ 與 $[\lambda I - A_{22}]$ 的 row,可發現若 $|\lambda| \ge 1$ 則這些 rows 互為 independent。故由 Hautus Lemma for controllability 可知 ,對 $|\lambda| \ge 1$而言,$(*)$ 的 rows 為 independent 故 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $
$(\Leftarrow)$ 假設 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $成立,我們要證明 系統 stabilizable 。亦即 考慮以下 partitioned system
\[\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( {k + 1} \right)}\\
{{x_2}\left( {k + 1} \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{{A_{11}}}&{{A_{12}}}\\
0&{{A_{22}}}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( k \right)}\\
{{x_2}\left( k \right)}
\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}
{{B_1}}\\
0
\end{array}} \right]u\left( k \right)\]其中 $(A_{11}, B_1)$ 為 controllable 且 $A_{22}$ 為 stable 注意 partitioned system 為 controllability canonical form,故 $(A_{11}, B_1)$ 已為 controllable ,故我們僅須證明 $A_{22}$ 為 stable 。
由 假設 $rank[\lambda I - A\;\; B] =n, \;\; \forall |\lambda| \ge 1 $ 我們可知 對任意 $|\lambda| \ge 1 $,
\[rank[\lambda I - A\;\;B] = rank\left[ {\begin{array}{*{20}{c}}
{\lambda I - {A_{11}}}&{ - {A_{12}}}&{{B_1}}\\
0&{\lambda I - {A_{22}}}&0
\end{array}} \right]\]具有 independent rows 。此暗示了 上述矩陣下排 $[\lambda I - A_{22} ]$ 亦有 full row rank $\forall |\lambda| \ge 1$ 故 $A_{22}$ 的 eigenvalue 必 $<1$ 故 $A_{22} $ 為 stable。
12/24/2013
[控制理論] 線性化(Linearization)
這次要跟大家介紹的是 線性化 (Linearization) 的概念,讀者建議須先具備基本 Taylor Series 概念,如果不熟悉的讀者可先參閱 [微積分] 泰勒展開式 與 泰勒級數 。
為何要做線性化?
其實線性化的動機很簡單,主要是因為一般在分析動態系統的時候,大部分系統行為都是呈現非線性(EX: 電路系統(二極體 I/V curve),倒單擺、撓性機構、機器人、生物細胞、金融模型...),但這些非線性行為會有一個大的困難,就是難以直接求解其動態行為。且發展成熟的線性系統理論沒有辦法(有效的)應用在上面,但如果能夠透過一些假設/機制,我們可以把原本非線性的系統轉成線性系統,如此一來原本沒辦法使用的線性系統理論便可以派上用場!!
如何做線性化?
至於實際如何做到對任意 非線性函數 (e.g., $\sin, \cos, \exp, x^n$, ...)線性化呢? 簡單來說,就是採用切線 (微分) 的概念,如果我們對關心的某一點對該點取導數,則我們可以得到一條對該點的切線,此切線可以在某種程度上用來近似 該點附近的函數行為。
----- 以下進入正題 ----
若用數學來描述非線性的系統可以寫成
\[
\dot x(t) = f(x)
\]其中 $x(t) \in \mathbb{R}^n$ 稱作系統狀態(state variable) (這邊考慮 $n$ 維空間,故有 $n$ 個系統狀態變數); $\dot x(t)$ 為系統狀態的一階導數; $f$ 為用以描述動態系統的任意函數
在此我們考慮系統狀態為 $n$ 階。意思就是有 $n$ 個不同的系統狀態,記做 $x \in \mathbb{R}^n$
在介紹線性化之前,我們得先介紹 "平衡點(equilibrium point)":
=====================
Definition: Equilibrium point
若 $f(\bar{x})=0$ ,則系統狀態 $\bar{x} \in \mathbb{R}^n$ 被稱作 平衡點(equilibrium point)。
=====================
Comments
由上述定義可以推知,如果 $x(0)=\bar{x}$ ,則 $x(t)=\bar{x}, \forall t \geq 0$ ;
也就是說一旦 在最一開始( $t=0$ )的時候,系統就處在平衡點的狀態,則對任意時刻 $t \geq 0$,系統狀態會持續處在平衡點的狀態。
====================
Definition: 穩定平衡點 (Stable equilibrium point)
平衡點若被稱為穩定的,或稱 穩定平衡點(stable equilibrium point),則其必須滿足 在任意時刻 之狀態 $x(t)$ 都需收斂到平衡點 $\bar{x}$,亦即
\[
x(t) \rightarrow \bar{x}
\]( $|| x(0)-\bar{x} ||$ 為足夠小 )
反之,若不收斂則稱為 不穩定的平衡點(unstable equilibrium) 其中
\[
|| x(0)-\bar{x} || := \left ( \displaystyle \sum_{i} (x_i(0)-\bar{x}_i)^2 \right )^{\frac{1}{2}}\] 為 2-norm
==================
Comments:
上述定義指明 所謂的 穩定平衡點是指 考慮 任意時刻的狀態 $x(t), \forall t$,若此狀態都會回到 某個平衡點 $\bar{x}$ 則我們說他是一個 穩定的平衡點。
在介紹完平衡點之後,我們便可介紹所謂的 線性化,誠如先前所說,線性化的基本概念是微分,所以在此我們會假設動態系統充分可微(smooth),故我們可以進行 泰勒展開 (微分近似)。
=================
線性化(Linearization):
注意:我們僅對 穩定平衡點 做線性化。(不穩定的平衡點亦可線性化只是實際用處不大)
現在我們回頭考慮 $n$ 階非線性系統
\[
\dot x(t) = f(x)
\]其系統狀態 $x(t)$ 可表為 平衡點狀態 $\bar{x}$ 加上 狀態(小擾動)增量( $\Delta x(t)$ );注意。在此我們假設擾動 $\Delta x$ 不能太大。
\[
x(t) = \bar{x} + \Delta x(t)
\]則我們可寫下
\[
f_1 (x) = f_1 (x+\Delta x)\]
若此 $f$ 為 平滑函數(smooth) (也就是說可以對其做泰勒展開),則我們可改寫上式如下:
對 $f_1$ 可寫出其泰勒展開式 (對 $0$ 點展開)
$\Rightarrow f_1(x) = f_1(\bar{x}) + \frac{\partial f_1}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_1}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$ ....(1)
同樣的,我們也可以對 $f_2...f_n$ 展開。
$\Rightarrow f_2(x) = f_2(\bar{x}) + \frac{\partial f_2}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_2}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T.$
$\vdots$
$\Rightarrow f_n(x) = f_n(\bar{x}) + \frac{\partial f_n}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_n}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$
其中 $H.O.T$ 表示 高階項(Higher Order Terms)
然後因為增量 $\Delta x_1, \Delta x_2...$ 假設為很小的擾動,在高階項的影響可被忽略
現在,回憶我們手邊有的狀態
\[
x(t) = \bar{x} + \Delta x(t)\]
對上式兩邊對時間微分,可得
\[
\dot x(t) = \Delta \dot x(t)\]
上式 $(2)$ 即稱為 線性化後的動態系統。由於此為線性,故所有的線性系統理論 (eigenvalue, controllability, observability) 便可以在其上進行討論
為何要做線性化?
其實線性化的動機很簡單,主要是因為一般在分析動態系統的時候,大部分系統行為都是呈現非線性(EX: 電路系統(二極體 I/V curve),倒單擺、撓性機構、機器人、生物細胞、金融模型...),但這些非線性行為會有一個大的困難,就是難以直接求解其動態行為。且發展成熟的線性系統理論沒有辦法(有效的)應用在上面,但如果能夠透過一些假設/機制,我們可以把原本非線性的系統轉成線性系統,如此一來原本沒辦法使用的線性系統理論便可以派上用場!!
如何做線性化?
至於實際如何做到對任意 非線性函數 (e.g., $\sin, \cos, \exp, x^n$, ...)線性化呢? 簡單來說,就是採用切線 (微分) 的概念,如果我們對關心的某一點對該點取導數,則我們可以得到一條對該點的切線,此切線可以在某種程度上用來近似 該點附近的函數行為。
https://controls.engin.umich.edu/wiki/index.php/LinearizingODEs
----- 以下進入正題 ----
若用數學來描述非線性的系統可以寫成
\[
\dot x(t) = f(x)
\]其中 $x(t) \in \mathbb{R}^n$ 稱作系統狀態(state variable) (這邊考慮 $n$ 維空間,故有 $n$ 個系統狀態變數); $\dot x(t)$ 為系統狀態的一階導數; $f$ 為用以描述動態系統的任意函數
在此我們考慮系統狀態為 $n$ 階。意思就是有 $n$ 個不同的系統狀態,記做 $x \in \mathbb{R}^n$
在介紹線性化之前,我們得先介紹 "平衡點(equilibrium point)":
=====================
Definition: Equilibrium point
若 $f(\bar{x})=0$ ,則系統狀態 $\bar{x} \in \mathbb{R}^n$ 被稱作 平衡點(equilibrium point)。
=====================
Comments
由上述定義可以推知,如果 $x(0)=\bar{x}$ ,則 $x(t)=\bar{x}, \forall t \geq 0$ ;
也就是說一旦 在最一開始( $t=0$ )的時候,系統就處在平衡點的狀態,則對任意時刻 $t \geq 0$,系統狀態會持續處在平衡點的狀態。
====================
Definition: 穩定平衡點 (Stable equilibrium point)
平衡點若被稱為穩定的,或稱 穩定平衡點(stable equilibrium point),則其必須滿足 在任意時刻 之狀態 $x(t)$ 都需收斂到平衡點 $\bar{x}$,亦即
\[
x(t) \rightarrow \bar{x}
\]( $|| x(0)-\bar{x} ||$ 為足夠小 )
反之,若不收斂則稱為 不穩定的平衡點(unstable equilibrium) 其中
\[
|| x(0)-\bar{x} || := \left ( \displaystyle \sum_{i} (x_i(0)-\bar{x}_i)^2 \right )^{\frac{1}{2}}\] 為 2-norm
==================
Comments:
上述定義指明 所謂的 穩定平衡點是指 考慮 任意時刻的狀態 $x(t), \forall t$,若此狀態都會回到 某個平衡點 $\bar{x}$ 則我們說他是一個 穩定的平衡點。
在介紹完平衡點之後,我們便可介紹所謂的 線性化,誠如先前所說,線性化的基本概念是微分,所以在此我們會假設動態系統充分可微(smooth),故我們可以進行 泰勒展開 (微分近似)。
=================
線性化(Linearization):
注意:我們僅對 穩定平衡點 做線性化。(不穩定的平衡點亦可線性化只是實際用處不大)
現在我們回頭考慮 $n$ 階非線性系統
\[
\dot x(t) = f(x)
\]其系統狀態 $x(t)$ 可表為 平衡點狀態 $\bar{x}$ 加上 狀態(小擾動)增量( $\Delta x(t)$ );注意。在此我們假設擾動 $\Delta x$ 不能太大。
\[
x(t) = \bar{x} + \Delta x(t)
\]則我們可寫下
\[
f_1 (x) = f_1 (x+\Delta x)\]
若此 $f$ 為 平滑函數(smooth) (也就是說可以對其做泰勒展開),則我們可改寫上式如下:
對 $f_1$ 可寫出其泰勒展開式 (對 $0$ 點展開)
$\Rightarrow f_1(x) = f_1(\bar{x}) + \frac{\partial f_1}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_1}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$ ....(1)
同樣的,我們也可以對 $f_2...f_n$ 展開。
$\Rightarrow f_2(x) = f_2(\bar{x}) + \frac{\partial f_2}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_2}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T.$
$\vdots$
$\Rightarrow f_n(x) = f_n(\bar{x}) + \frac{\partial f_n}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_n}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$
其中 $H.O.T$ 表示 高階項(Higher Order Terms)
然後因為增量 $\Delta x_1, \Delta x_2...$ 假設為很小的擾動,在高階項的影響可被忽略
現在,回憶我們手邊有的狀態
\[
x(t) = \bar{x} + \Delta x(t)\]
對上式兩邊對時間微分,可得
\[
\dot x(t) = \Delta \dot x(t)\]
再者,因為我們知道 系統為 $\dot x(t) = f(x)$, 由式 (1) 我們可以帶入泰勒展開到 $f(x)$ 之中,最後整理可得線性化之後的 增量(擾動)系統
\[
\Delta \dot x(t) = A \cdot \Delta x(t) \ \ \ \ (2) \]
\Delta \dot x(t) = A \cdot \Delta x(t) \ \ \ \ (2) \]
其中 $A$ 為矩陣其第 (i,j) 元素由下式表示
\[
a_{ij} = \frac{\partial f_i}{\partial x_j}|_{x=\bar{x}}\]
a_{ij} = \frac{\partial f_i}{\partial x_j}|_{x=\bar{x}}\]
上式 $(2)$ 即稱為 線性化後的動態系統。由於此為線性,故所有的線性系統理論 (eigenvalue, controllability, observability) 便可以在其上進行討論
8/10/2011
[線性系統] 離散時間 LTI 系統的漸進穩定度
考慮離散時間系統
\[
x(k+1) = Ax(k) + Bu(k)
\]若 $A$ 為 穩定矩陣,且 $u(k) \to 0$ 則 $x(k) \to 0$
Proof:
我們要證明 $x(k) \to 0$,故給定任意 $\varepsilon>0$,要證明 存在 $M>0$ 使得 對任意 $k \ge M$,我們有
\[
|x(k)| \le \varepsilon
\]
注意到該系統 $x(k+1) = Ax(k) + Bu(k)$ 的解為
\[{x(k) = {A^k}x(0) + \sum\limits_{i = 0}^{k - 1} {{A^{k - 1 - j}}Bu(j)} }
\]兩邊同取 norm 並利用三角不等式 可得
\[\begin{array}{*{20}{l}}
{\left| {x(k)} \right| = \left| {{A^k}x(0) + \sum\limits_{i = 0}^{k - 1} {{A^{k - 1 - j}}Bu(j)} } \right|}\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le \left| {{A^k}} \right|\left| {x(0)} \right| + \sum\limits_{i = 0}^{k - 1} {\left| {{A^{k - 1 - j}}} \right|\left| B \right|} \left| {u(j)} \right|}
\end{array}\ \ \ \ \ (*)
\]回憶 Horn 與 Johnson (1985) 的結果:
==================
FACT:
\[
|A^k| \le c \lambda^k, \; c>0 \;\; \max_i |eig_i(A)| < \lambda <1
\]==================
故
\[\left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + c\left| B \right|\sum\limits_{j = 0}^{\infty} {{\lambda ^{k - 1 - j}}\left| {u(j)} \right|} \]現在利用已知假設 $u(k) \to 0$ 我們可推知必存在 $ N > 0$ 使得 對任意 $k \ge N$,我們有
\[\left| {u(k)} \right| \le \frac{{\varepsilon \left( {1 - \lambda } \right)}}{{2c{\lambda ^k}\left| B \right|}}\]將上述結果代入 $(*)$ 可得
\[\begin{array}{l}
\left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + c\left| B \right|\sum\limits_{j = 0}^\infty {{\lambda ^{k - 1 - j}}\frac{{\varepsilon \left( {1 - \lambda } \right)}}{{2c{\lambda ^k}\left| B \right|}}} \\
\Rightarrow \left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + \frac{\varepsilon }{2}
\end{array}\]由於 $\lambda <1$ 我們可選 $M'>0$ 使得 對任意 $k \ge \max (M', N)$
\[
c\lambda^k |x(N)| \le \varepsilon/2, \;\; \forall k \ge m'
\]現在結合前述結果我們可推得 對任意 $k \ge M = \max(M', N)$,
\[\left| {x(k)} \right| \le \varepsilon
\]即為所求。 $\square$
\[
x(k+1) = Ax(k) + Bu(k)
\]若 $A$ 為 穩定矩陣,且 $u(k) \to 0$ 則 $x(k) \to 0$
Proof:
我們要證明 $x(k) \to 0$,故給定任意 $\varepsilon>0$,要證明 存在 $M>0$ 使得 對任意 $k \ge M$,我們有
\[
|x(k)| \le \varepsilon
\]
注意到該系統 $x(k+1) = Ax(k) + Bu(k)$ 的解為
\[{x(k) = {A^k}x(0) + \sum\limits_{i = 0}^{k - 1} {{A^{k - 1 - j}}Bu(j)} }
\]兩邊同取 norm 並利用三角不等式 可得
\[\begin{array}{*{20}{l}}
{\left| {x(k)} \right| = \left| {{A^k}x(0) + \sum\limits_{i = 0}^{k - 1} {{A^{k - 1 - j}}Bu(j)} } \right|}\\
{\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} \le \left| {{A^k}} \right|\left| {x(0)} \right| + \sum\limits_{i = 0}^{k - 1} {\left| {{A^{k - 1 - j}}} \right|\left| B \right|} \left| {u(j)} \right|}
\end{array}\ \ \ \ \ (*)
\]回憶 Horn 與 Johnson (1985) 的結果:
==================
FACT:
\[
|A^k| \le c \lambda^k, \; c>0 \;\; \max_i |eig_i(A)| < \lambda <1
\]==================
故
\[\left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + c\left| B \right|\sum\limits_{j = 0}^{\infty} {{\lambda ^{k - 1 - j}}\left| {u(j)} \right|} \]現在利用已知假設 $u(k) \to 0$ 我們可推知必存在 $ N > 0$ 使得 對任意 $k \ge N$,我們有
\[\left| {u(k)} \right| \le \frac{{\varepsilon \left( {1 - \lambda } \right)}}{{2c{\lambda ^k}\left| B \right|}}\]將上述結果代入 $(*)$ 可得
\[\begin{array}{l}
\left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + c\left| B \right|\sum\limits_{j = 0}^\infty {{\lambda ^{k - 1 - j}}\frac{{\varepsilon \left( {1 - \lambda } \right)}}{{2c{\lambda ^k}\left| B \right|}}} \\
\Rightarrow \left| {x(k)} \right| \le c{\lambda ^k}\left| {x(0)} \right| + \frac{\varepsilon }{2}
\end{array}\]由於 $\lambda <1$ 我們可選 $M'>0$ 使得 對任意 $k \ge \max (M', N)$
\[
c\lambda^k |x(N)| \le \varepsilon/2, \;\; \forall k \ge m'
\]現在結合前述結果我們可推得 對任意 $k \ge M = \max(M', N)$,
\[\left| {x(k)} \right| \le \varepsilon
\]即為所求。 $\square$
8/02/2011
[線性系統] 漸進穩定度 與 Lyapunov Theorem
這次要介紹如何 透過 Lyapunov Theorem 來檢驗線性系統 ${\bf{\dot x}} = {\bf{Ax}}$ 的漸進穩定度 (Asymptotic Stability)。關於非線性系統的漸進穩定度讀者可參考下列兩篇文章:
現在回憶我們先前提過控制系統的兩種絕對穩定度:BIBO穩定 與 漸進穩定度。
概念上 BIBO穩定為插上電源看看系統會不會壞掉,漸進穩定則是測試拔掉電源看看系統會不會停止。
Lyapunov Energy Ideas
一般而言,Lyapunov 觀點是透過能量的角度看系統穩定度。也就是說考慮系統狀態 ${\bf{x}}\left( t \right) $,那麼
\[
{\bf{x}}\left( t \right) \to 0 \Leftrightarrow {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) \to 0
\] 注意到上述 ${{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right)$ 可看成能量。那麼為了達成上式,我們可以透過 能量對時間的變化率 (系統狀態能量對時間微分) 若為負值,則表示能量在逐漸溢散(decaying energy),亦即可透過
\[
\frac{d}{dt} {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) <0
\] 達成 ${\bf{x}}\left( t \right) \to 0 \Leftrightarrow {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) \to 0$
注意:這邊我們說 ${\bf{A}}$ 矩陣為穩定若下面條件成立:
對 ${\bf{A}}$ 的所有 eigenvalue 有負實部。
現在我們看一個例子來展示 Lyapunov Energy Idea,
Example
考慮
\[{\bf{\dot x}}\left( t \right) = \left[ {\begin{array}{*{20}{c}}
{ - 1}&0\\
2&{ - 3}
\end{array}} \right]{\bf{x}}\left( t \right)
\]現試著找出系統能量是否 decaying?
Solution
注意到此系統 $\bf A$ 矩陣 為常數下三角矩陣,其 eigenvalue 為 $-1, -3$ 由穩定度定理可知系統為穩定系統。現在我們看看 Lyapunov Energy Idea 是否也可以幫助我們判別系統穩定度。
首先觀察系統狀態能量的微分
\[\begin{array}{l}
\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = \frac{d}{{dt}}\left( {\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( t \right)}&{{x_2}\left( t \right)}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( t \right)}\\
{{x_2}\left( t \right)}
\end{array}} \right]} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = \frac{d}{{dt}}\left( {{x_1}^2\left( t \right) + {x_2}^2\left( t \right)} \right) = 2{x_1}\left( t \right){{\dot x}_1}\left( t \right) + 2{x_2}\left( t \right){{\dot x}_2}\left( t \right)
\end{array}
\]又因為
\[{\bf{\dot x}}\left( t \right) = \left[ {\begin{array}{*{20}{c}}
{ - 1}&0\\
2&{ - 3}
\end{array}} \right]{\bf{x}}\left( t \right) \Leftrightarrow \left[ {\begin{array}{*{20}{c}}
{{{\dot x}_1}\left( t \right)}\\
{{{\dot x}_2}\left( t \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{ - {x_1}\left( t \right)}\\
{2{x_1}\left( t \right) - 3{x_2}\left( t \right)}
\end{array}} \right]
\]故我們可得
\[\begin{array}{l}
\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = 2{x_1}\left( t \right){{\dot x}_1}\left( t \right) + 2{x_2}\left( t \right){{\dot x}_2}\left( t \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = 2{x_1}\left( t \right)\left( { - {x_1}\left( t \right)} \right) + 2{x_2}\left( t \right)\left( {2{x_1}\left( t \right) - 3{x_2}\left( t \right)} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = - 2{x_1}^2\left( t \right) + 4{x_2}\left( t \right){x_1}\left( t \right) - 6{x_2}^2\left( t \right) \ \ \ \ (*)
\end{array}
\]現在若上式 $<0$ 則我們由 Lyapunov Energy Ideas 即可斷定系統狀態 ${\bf{x}}\left( t \right) \rightarrow 0$。故我們進一步改寫 $(*)$ 成矩陣形式:
\[\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = {{\bf{x}}^T}\left( t \right)\underbrace {\left[ {\begin{array}{*{20}{c}}
{ - 2}&2\\
2&{ - 6}
\end{array}} \right]}_Q{\bf{x}}\left( t \right)
\]注意到上述矩陣 $Q$ 為 對稱 負定矩陣(negative definite ) 因為 由對稱負定矩陣定義 : $-Q$ 必須為正定矩陣。由於
\[-Q = \left[ {\begin{array}{*{20}{c}}
2&{ - 2}\\
{ - 2}&6
\end{array}} \right]
\]其對應的
1st Leading principal minor: $= 2 >0$,
2nd Leading principal minor: $= 2 \times 6 - (-2) \times (-2) = 8>0$,故 $Q$ 為負定矩陣。且我們知道此系統能量會溢散。亦即 Lyapunov Energy Ideas 確實可以幫助我們判斷系統穩定度。
現在看下面這個定理:
=======================
Theorem: Lyapunov Theorem
${\bf{A}}$ 矩陣的 所有 eigenvalue 有 負實部 ( ${\bf{A}}$ 矩陣 為穩定) 若且為若
對任意給定 正定對稱 (Positive definite symmetric) 矩陣 ${\bf {Q}}$,其 Lyapunov equation
\[
{{\bf{A}}^T}{\bf{P + PA = }} - {\bf{Q}}
\]有 唯一解 ${\bf {P}}$, 且此唯一解 ${\bf {P}}$ 為 正定對稱矩陣。
=======================
上述定理與 Lyapunov Energy 能量觀點可以整合
對 ${\bf{\dot x}}\left( t \right) = {\bf{Ax}}\left( t \right)$,現在定義 Energy-like function
\[V\left( {\bf{x}} \right){\rm{ }}: = {{\bf{x}}^T}\left( t \right){\bf{Px}}\left( t \right)\]
其中 $\bf P$ 為 Lyapunov equation ${{\bf{A}}^T}{\bf{P}} + {\bf{PA}} = - {\bf{Q}} $ 的解。則
\[
\frac{d}{dt} {\bf V(x(t))} <0
\]為系統漸進穩定度的判別條件。
現在回憶我們先前提過控制系統的兩種絕對穩定度:BIBO穩定 與 漸進穩定度。
概念上 BIBO穩定為插上電源看看系統會不會壞掉,漸進穩定則是測試拔掉電源看看系統會不會停止。
Lyapunov Energy Ideas
一般而言,Lyapunov 觀點是透過能量的角度看系統穩定度。也就是說考慮系統狀態 ${\bf{x}}\left( t \right) $,那麼
\[
{\bf{x}}\left( t \right) \to 0 \Leftrightarrow {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) \to 0
\] 注意到上述 ${{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right)$ 可看成能量。那麼為了達成上式,我們可以透過 能量對時間的變化率 (系統狀態能量對時間微分) 若為負值,則表示能量在逐漸溢散(decaying energy),亦即可透過
\[
\frac{d}{dt} {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) <0
\] 達成 ${\bf{x}}\left( t \right) \to 0 \Leftrightarrow {{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) \to 0$
注意:這邊我們說 ${\bf{A}}$ 矩陣為穩定若下面條件成立:
對 ${\bf{A}}$ 的所有 eigenvalue 有負實部。
現在我們看一個例子來展示 Lyapunov Energy Idea,
Example
考慮
\[{\bf{\dot x}}\left( t \right) = \left[ {\begin{array}{*{20}{c}}
{ - 1}&0\\
2&{ - 3}
\end{array}} \right]{\bf{x}}\left( t \right)
\]現試著找出系統能量是否 decaying?
Solution
注意到此系統 $\bf A$ 矩陣 為常數下三角矩陣,其 eigenvalue 為 $-1, -3$ 由穩定度定理可知系統為穩定系統。現在我們看看 Lyapunov Energy Idea 是否也可以幫助我們判別系統穩定度。
首先觀察系統狀態能量的微分
\[\begin{array}{l}
\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = \frac{d}{{dt}}\left( {\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( t \right)}&{{x_2}\left( t \right)}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{x_1}\left( t \right)}\\
{{x_2}\left( t \right)}
\end{array}} \right]} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = \frac{d}{{dt}}\left( {{x_1}^2\left( t \right) + {x_2}^2\left( t \right)} \right) = 2{x_1}\left( t \right){{\dot x}_1}\left( t \right) + 2{x_2}\left( t \right){{\dot x}_2}\left( t \right)
\end{array}
\]又因為
\[{\bf{\dot x}}\left( t \right) = \left[ {\begin{array}{*{20}{c}}
{ - 1}&0\\
2&{ - 3}
\end{array}} \right]{\bf{x}}\left( t \right) \Leftrightarrow \left[ {\begin{array}{*{20}{c}}
{{{\dot x}_1}\left( t \right)}\\
{{{\dot x}_2}\left( t \right)}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{ - {x_1}\left( t \right)}\\
{2{x_1}\left( t \right) - 3{x_2}\left( t \right)}
\end{array}} \right]
\]故我們可得
\[\begin{array}{l}
\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = 2{x_1}\left( t \right){{\dot x}_1}\left( t \right) + 2{x_2}\left( t \right){{\dot x}_2}\left( t \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = 2{x_1}\left( t \right)\left( { - {x_1}\left( t \right)} \right) + 2{x_2}\left( t \right)\left( {2{x_1}\left( t \right) - 3{x_2}\left( t \right)} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = - 2{x_1}^2\left( t \right) + 4{x_2}\left( t \right){x_1}\left( t \right) - 6{x_2}^2\left( t \right) \ \ \ \ (*)
\end{array}
\]現在若上式 $<0$ 則我們由 Lyapunov Energy Ideas 即可斷定系統狀態 ${\bf{x}}\left( t \right) \rightarrow 0$。故我們進一步改寫 $(*)$ 成矩陣形式:
\[\frac{d}{{dt}}{{\bf{x}}^T}\left( t \right){\bf{x}}\left( t \right) = {{\bf{x}}^T}\left( t \right)\underbrace {\left[ {\begin{array}{*{20}{c}}
{ - 2}&2\\
2&{ - 6}
\end{array}} \right]}_Q{\bf{x}}\left( t \right)
\]注意到上述矩陣 $Q$ 為 對稱 負定矩陣(negative definite ) 因為 由對稱負定矩陣定義 : $-Q$ 必須為正定矩陣。由於
\[-Q = \left[ {\begin{array}{*{20}{c}}
2&{ - 2}\\
{ - 2}&6
\end{array}} \right]
\]其對應的
1st Leading principal minor: $= 2 >0$,
2nd Leading principal minor: $= 2 \times 6 - (-2) \times (-2) = 8>0$,故 $Q$ 為負定矩陣。且我們知道此系統能量會溢散。亦即 Lyapunov Energy Ideas 確實可以幫助我們判斷系統穩定度。
現在看下面這個定理:
=======================
Theorem: Lyapunov Theorem
${\bf{A}}$ 矩陣的 所有 eigenvalue 有 負實部 ( ${\bf{A}}$ 矩陣 為穩定) 若且為若
對任意給定 正定對稱 (Positive definite symmetric) 矩陣 ${\bf {Q}}$,其 Lyapunov equation
\[
{{\bf{A}}^T}{\bf{P + PA = }} - {\bf{Q}}
\]有 唯一解 ${\bf {P}}$, 且此唯一解 ${\bf {P}}$ 為 正定對稱矩陣。
=======================
對 ${\bf{\dot x}}\left( t \right) = {\bf{Ax}}\left( t \right)$,現在定義 Energy-like function
\[V\left( {\bf{x}} \right){\rm{ }}: = {{\bf{x}}^T}\left( t \right){\bf{Px}}\left( t \right)\]
其中 $\bf P$ 為 Lyapunov equation ${{\bf{A}}^T}{\bf{P}} + {\bf{PA}} = - {\bf{Q}} $ 的解。則
\[
\frac{d}{dt} {\bf V(x(t))} <0
\]為系統漸進穩定度的判別條件。
[線性系統] LTI 系統的輸入輸出 BIBO 穩定度
這次要介紹線性系統的穩定度。一般而言在設計控制系統的時候第一步就是要檢驗系統是否穩定,如果不穩定則往往導致系統損毀。不可不慎。
一般而言控制系統穩定度可區分兩類
考慮一個 SISO LTI 系統描述如下:
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]其中 $g(t)$ 為系統脈衝響應(impulse response)
現在我們給出下面定義
====================
Definition: Bounded function
一個輸入函數 $u(t)$ 稱作有界 (bounded) 如果下列條件成立:
若存在一個夠大的常數 $u_M$ 使得
\[
|u(t)| \le u_M < \infty, \; \forall t \ge 0
\]====================
有了有界函數的定義,我們可以定義何謂 BIBO 穩定
====================
Definition: BIBO stability
一個系統被稱為 BIBO stable (Bounded input bounded output stable) 若下列條件成立:
對任意有界輸入,系統都產生有界輸出。則此系統為 BIBO 穩定。
====================
Comment:
1. BIBO 穩定度 只定義在 zero-state response 且系統假設為鬆弛系統亦即初始狀態為零。
2. 上述 BIBO 定義 陳述等價如下:
考慮系統 輸入為 $u(t)$,輸出為 $y(t)$,現若存在 $M, N >0$ 使得
\[
|u(t)| \le M < \infty \Rightarrow |y(t)| \le N < \infty
\]則系統稱為 BIBO穩定。
現在我們看個重要的定理:
=====================
Theorem: BIBO stability criterion of LTI system
考慮 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]為 BIBO stable 若且為若 存在一個夠大的常數 $M$ 使得
\[
\int_0^\infty |g(t)|dt \le M < \infty
\]=====================
Proof
我們首先證明 $\Leftarrow$,亦即
假設
\[
\int_0^\infty |g(t)|dt \le M < \infty
\] 欲證 LTI 系統 為 BIBO穩定。
故由BIBO定義,給定 $u(t)$ 滿足 $|u(t)| \le u_M < \infty$,要證明 $|y(t)| < \infty$。
由於
\[\begin{array}{l}
\left| {y(t)} \right| = \left| {\int_0^t g (\tau )u(t - \tau )d\tau } \right|\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \le \int_0^t {\left| {g(\tau )u(t - \tau )} \right|} d\tau \le {u_M}\int_0^t {\left| {g(\tau )} \right|} d\tau
\end{array}
\]現在由假設 $\int_0^\infty |g(t)|dt \le M < \infty$,我們可得
\[\left| {y(t)} \right| \le {u_M}\int_0^t {\left| {g(\tau )} \right|} d\tau \le {u_M}\int_0^\infty {\left| {g(\tau )} \right|} d\tau \le {u_M}M < \infty
\] 故得證。
接著我們證明 $\Rightarrow$。亦即需要證明
若 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]為 BIBO stable,則 存在一個夠大的常數 $M$ 使得
\[
\int_0^\infty |g(t)|dt \le M < \infty
\]
現在我們取非,利用反證法 改證
對所有常數 $M$,\[
\int_0^\infty |g(t)|dt >M
\],則 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]不為 BIBO stable (存在一組輸入 $u(t)$ 使得 輸出 $y(t) = \infty$)
首先注意到由於對所有 $M$,
\[
\int_0^\infty |g(t)|dt >M
\],此陳述等價於 存在一個 $t_1$ 使得
\[
\int_0^{t_1} |g(t)|dt = \infty
\]接著我們要證明 LTI 系統不為 BIBO stable,故現在建構一組輸入 $u(t)$ 滿足下式
\[u\left( t_1 - \tau \right) := {\rm sgn}(g(\tau) )= \left\{ \begin{array}{l}
1,\begin{array}{*{20}{c}}
{}
\end{array}{\rm if}\begin{array}{*{20}{c}}
{}
\end{array}g\left( \tau \right) \ge 0\\
- 1,\begin{array}{*{20}{c}}
{}
\end{array}{\rm if}\begin{array}{*{20}{c}}
{}
\end{array}g\left( \tau \right) < 0
\end{array} \right.
\]則其對應的輸出
\[y({t_1}) = \int_0^{{t_1}} g (\tau )u({t_1} - \tau )d\tau = \int_0^{{t_1}} {\left| {g(\tau )} \right|} d\tau = \infty \]故此系統不為 BIBO stable。至此得證。$\square$
Comment:
1. 上述結果等價如下:
若系統為 LTI 系統,則 系統 BIBO 穩定的充分必要條件為
其系統轉移函數對應的極點 $p_i$ 具有負實部;亦即
\[
Re[p_i] <0, i=1,2,...,n
\]
2. 若考慮系統為 SISO LTI 系統,且轉移函數 沒有發生極零點對消 (pole-zero cancelation),則系統特性根 poles = Eigenvalues ;亦即 BIBO穩定 = 漸進穩定度。
3. 若轉移函數 發生極零點對消 (此時 eigenvalue 的數目會多於 pole 的數目 (因為 pole 被 zero消了!!) ) 且 極零點對消在左半面,BIBO = 漸進穩定;若對消在右半面 或者 虛軸上,則 BIBO 不等於 漸進穩定。亦即 BIBO 穩定不一定為 漸進穩定。
4. 若 $\dot x = Ax + Bu;\;\; y=Cx$ 則取拉式轉換我們有
\[\begin{array}{l}
\left\{ \begin{array}{l}
X\left( s \right) = {\left( {sI - A} \right)^{ - 1}}x\left( 0 \right) + {\left( {sI - A} \right)^{ - 1}}BU\left( s \right)\\
Y\left( s \right) = CX\left( x \right)
\end{array} \right.\\
\Rightarrow Y\left( s \right) = \underbrace {\left[ {C{{\left( {sI - A} \right)}^{ - 1}}} \right]}_{{\rm{Free}}\begin{array}{*{20}{c}}
{}
\end{array}{\rm{Response}}}x\left( 0 \right) + \underbrace {\left[ {C{{\left( {sI - A} \right)}^{ - 1}}B} \right]}_{{\rm{Force}}\begin{array}{*{20}{c}}
{}
\end{array}{\rm{Response}}}U\left( s \right)
\end{array}\]
我們以下用個例子來看看剛剛討論的 pole-zero cancellation 現象 與 BIBO/Asymptotic stability。
Example: (BIBO stability does NOT imply Asymptotic stability)
考慮系統
\[\left\{ \begin{array}{l}
\dot x = Ax + Bu = \left[ {\begin{array}{*{20}{c}}
0&1\\
2&{ - 1}
\end{array}} \right]x + \left[ {\begin{array}{*{20}{c}}
0\\
1
\end{array}} \right]u\\
y = Cx = \left[ {\begin{array}{*{20}{c}}
{ - 2}&2
\end{array}} \right]x
\end{array} \right.
\](a) 試求 $A$ 矩陣 eigenvalue。此系統是否為 asymptotic stable?
(b) 試求此系統轉移函數?
(c) 試求此系統 unit step response,試問其對應的系統輸出 是否為 BIBO?
Solution: (a)
首先求 $A$ 矩陣的 eigenvalue:計算特性方程 $\det(sI-A) =0$ 可得
\[\begin{array}{l}
\det \left( {sI - A} \right) = 0\\
\Rightarrow \det \left( {\left[ {\begin{array}{*{20}{c}}
s&0\\
0&s
\end{array}} \right] - \left[ {\begin{array}{*{20}{c}}
0&1\\
2&{ - 1}
\end{array}} \right]} \right) = \det \left[ {\begin{array}{*{20}{c}}
s&{ - 1}\\
{ - 2}&{s + 1}
\end{array}} \right] = s\left( {s + 1} \right) - 2 = 0\\
\Rightarrow {s^2} + s - 2 = 0 \Rightarrow \left\{ \begin{array}{l}
s = - 2\\
s = 1
\end{array} \right.
\end{array}
\]注意到此系統有一個 eigenvalue 為 $s=1$ (落在 s-plane 右半面),故系統不為漸進穩定。
(b):
接著我們計算轉移函數
\[\begin{array}{l}
G\left( s \right) = C{\left( {sI - A} \right)^{ - 1}}B\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \left[ {\begin{array}{*{20}{c}}
{ - 2}&2
\end{array}} \right]{\left[ {\begin{array}{*{20}{c}}
s&{ - 1}\\
{ - 2}&{s + 1}
\end{array}} \right]^{ - 1}}\left[ {\begin{array}{*{20}{c}}
0\\
1
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{{2s - 2}}{{{s^2} + s - 2}} = \frac{{2\left( {s - 1} \right)}}{{\left( {s + 2} \right)\left( {s - 1} \right)}} = \frac{2}{{s + 2}}
\end{array}\]注意到此時發生 pole-zero cancellation ($s=1$ 對消在右半面) !!
(c):
接著我們計算 unit-step response (注意到 unit-step 為 Bounded-input)
\[\begin{array}{l}
Y\left( s \right) = G\left( s \right)U\left( s \right) = \left( {\frac{2}{{s + 2}}} \right)\left( {\frac{1}{s}} \right) = \frac{2}{{s\left( {s + 2} \right)}} = \frac{1}{s} + \frac{{ - 1}}{{s + 2}}\\
\Rightarrow y\left( t \right) = 1 - {e^{ - 2t}}
\end{array}\]可發現系統輸出 $|y(t)| \le 1$ 亦即為 Bounded output。故系統為 BIBO 系統 under unit-step input。
一般而言控制系統穩定度可區分兩類
- 絕對穩定度:
指系統是否穩定的指標:一般而言有 BIBO 穩定 與 漸進穩定。 - 相對穩定度:指系統穩定程度的指標: 一般而言由 pole location,Phase Margin, Gain Margin 決定
- Routh-Hurwitz criterion
只適用於線性系統,有興趣讀者可自行參閱任何一本自動控制教科書都會有詳細介紹。 - Lyapunov energy approach
對線性/非線性系統皆適用。
Comment:
給不關心理論的讀者:事實上,在實用面上,大多時候我們可以直接使用 MATLAB 等套裝軟體直接求解 eigenvalue 並且判斷是否落在 s-plane 的左半面即可 (如果落在左半面不含虛軸,我們稱此系統 "穩定" )。
考慮一個 SISO LTI 系統描述如下:
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]其中 $g(t)$ 為系統脈衝響應(impulse response)
現在我們給出下面定義
====================
Definition: Bounded function
一個輸入函數 $u(t)$ 稱作有界 (bounded) 如果下列條件成立:
若存在一個夠大的常數 $u_M$ 使得
\[
|u(t)| \le u_M < \infty, \; \forall t \ge 0
\]====================
有了有界函數的定義,我們可以定義何謂 BIBO 穩定
====================
Definition: BIBO stability
一個系統被稱為 BIBO stable (Bounded input bounded output stable) 若下列條件成立:
對任意有界輸入,系統都產生有界輸出。則此系統為 BIBO 穩定。
====================
1. BIBO 穩定度 只定義在 zero-state response 且系統假設為鬆弛系統亦即初始狀態為零。
2. 上述 BIBO 定義 陳述等價如下:
考慮系統 輸入為 $u(t)$,輸出為 $y(t)$,現若存在 $M, N >0$ 使得
\[
|u(t)| \le M < \infty \Rightarrow |y(t)| \le N < \infty
\]則系統稱為 BIBO穩定。
現在我們看個重要的定理:
=====================
Theorem: BIBO stability criterion of LTI system
考慮 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]為 BIBO stable 若且為若 存在一個夠大的常數 $M$ 使得
\[
\int_0^\infty |g(t)|dt \le M < \infty
\]=====================
Proof
我們首先證明 $\Leftarrow$,亦即
假設
\[
\int_0^\infty |g(t)|dt \le M < \infty
\] 欲證 LTI 系統 為 BIBO穩定。
故由BIBO定義,給定 $u(t)$ 滿足 $|u(t)| \le u_M < \infty$,要證明 $|y(t)| < \infty$。
由於
\[\begin{array}{l}
\left| {y(t)} \right| = \left| {\int_0^t g (\tau )u(t - \tau )d\tau } \right|\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \le \int_0^t {\left| {g(\tau )u(t - \tau )} \right|} d\tau \le {u_M}\int_0^t {\left| {g(\tau )} \right|} d\tau
\end{array}
\]現在由假設 $\int_0^\infty |g(t)|dt \le M < \infty$,我們可得
\[\left| {y(t)} \right| \le {u_M}\int_0^t {\left| {g(\tau )} \right|} d\tau \le {u_M}\int_0^\infty {\left| {g(\tau )} \right|} d\tau \le {u_M}M < \infty
\] 故得證。
接著我們證明 $\Rightarrow$。亦即需要證明
若 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]為 BIBO stable,則 存在一個夠大的常數 $M$ 使得
\[
\int_0^\infty |g(t)|dt \le M < \infty
\]
現在我們取非,利用反證法 改證
對所有常數 $M$,\[
\int_0^\infty |g(t)|dt >M
\],則 SISO LTI 系統
\[
y(t) = \int_0^t g(t-\tau)u(\tau)d \tau = \int_0^t g(\tau) u(t- \tau)d\tau
\]不為 BIBO stable (存在一組輸入 $u(t)$ 使得 輸出 $y(t) = \infty$)
首先注意到由於對所有 $M$,
\[
\int_0^\infty |g(t)|dt >M
\],此陳述等價於 存在一個 $t_1$ 使得
\[
\int_0^{t_1} |g(t)|dt = \infty
\]接著我們要證明 LTI 系統不為 BIBO stable,故現在建構一組輸入 $u(t)$ 滿足下式
\[u\left( t_1 - \tau \right) := {\rm sgn}(g(\tau) )= \left\{ \begin{array}{l}
1,\begin{array}{*{20}{c}}
{}
\end{array}{\rm if}\begin{array}{*{20}{c}}
{}
\end{array}g\left( \tau \right) \ge 0\\
- 1,\begin{array}{*{20}{c}}
{}
\end{array}{\rm if}\begin{array}{*{20}{c}}
{}
\end{array}g\left( \tau \right) < 0
\end{array} \right.
\]則其對應的輸出
\[y({t_1}) = \int_0^{{t_1}} g (\tau )u({t_1} - \tau )d\tau = \int_0^{{t_1}} {\left| {g(\tau )} \right|} d\tau = \infty \]故此系統不為 BIBO stable。至此得證。$\square$
Comment:
1. 上述結果等價如下:
若系統為 LTI 系統,則 系統 BIBO 穩定的充分必要條件為
其系統轉移函數對應的極點 $p_i$ 具有負實部;亦即
\[
Re[p_i] <0, i=1,2,...,n
\]
2. 若考慮系統為 SISO LTI 系統,且轉移函數 沒有發生極零點對消 (pole-zero cancelation),則系統特性根 poles = Eigenvalues ;亦即 BIBO穩定 = 漸進穩定度。
3. 若轉移函數 發生極零點對消 (此時 eigenvalue 的數目會多於 pole 的數目 (因為 pole 被 zero消了!!) ) 且 極零點對消在左半面,BIBO = 漸進穩定;若對消在右半面 或者 虛軸上,則 BIBO 不等於 漸進穩定。亦即 BIBO 穩定不一定為 漸進穩定。
4. 若 $\dot x = Ax + Bu;\;\; y=Cx$ 則取拉式轉換我們有
\[\begin{array}{l}
\left\{ \begin{array}{l}
X\left( s \right) = {\left( {sI - A} \right)^{ - 1}}x\left( 0 \right) + {\left( {sI - A} \right)^{ - 1}}BU\left( s \right)\\
Y\left( s \right) = CX\left( x \right)
\end{array} \right.\\
\Rightarrow Y\left( s \right) = \underbrace {\left[ {C{{\left( {sI - A} \right)}^{ - 1}}} \right]}_{{\rm{Free}}\begin{array}{*{20}{c}}
{}
\end{array}{\rm{Response}}}x\left( 0 \right) + \underbrace {\left[ {C{{\left( {sI - A} \right)}^{ - 1}}B} \right]}_{{\rm{Force}}\begin{array}{*{20}{c}}
{}
\end{array}{\rm{Response}}}U\left( s \right)
\end{array}\]
我們以下用個例子來看看剛剛討論的 pole-zero cancellation 現象 與 BIBO/Asymptotic stability。
Example: (BIBO stability does NOT imply Asymptotic stability)
考慮系統
\[\left\{ \begin{array}{l}
\dot x = Ax + Bu = \left[ {\begin{array}{*{20}{c}}
0&1\\
2&{ - 1}
\end{array}} \right]x + \left[ {\begin{array}{*{20}{c}}
0\\
1
\end{array}} \right]u\\
y = Cx = \left[ {\begin{array}{*{20}{c}}
{ - 2}&2
\end{array}} \right]x
\end{array} \right.
\](a) 試求 $A$ 矩陣 eigenvalue。此系統是否為 asymptotic stable?
(b) 試求此系統轉移函數?
(c) 試求此系統 unit step response,試問其對應的系統輸出 是否為 BIBO?
Solution: (a)
首先求 $A$ 矩陣的 eigenvalue:計算特性方程 $\det(sI-A) =0$ 可得
\[\begin{array}{l}
\det \left( {sI - A} \right) = 0\\
\Rightarrow \det \left( {\left[ {\begin{array}{*{20}{c}}
s&0\\
0&s
\end{array}} \right] - \left[ {\begin{array}{*{20}{c}}
0&1\\
2&{ - 1}
\end{array}} \right]} \right) = \det \left[ {\begin{array}{*{20}{c}}
s&{ - 1}\\
{ - 2}&{s + 1}
\end{array}} \right] = s\left( {s + 1} \right) - 2 = 0\\
\Rightarrow {s^2} + s - 2 = 0 \Rightarrow \left\{ \begin{array}{l}
s = - 2\\
s = 1
\end{array} \right.
\end{array}
\]注意到此系統有一個 eigenvalue 為 $s=1$ (落在 s-plane 右半面),故系統不為漸進穩定。
(b):
接著我們計算轉移函數
\[\begin{array}{l}
G\left( s \right) = C{\left( {sI - A} \right)^{ - 1}}B\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \left[ {\begin{array}{*{20}{c}}
{ - 2}&2
\end{array}} \right]{\left[ {\begin{array}{*{20}{c}}
s&{ - 1}\\
{ - 2}&{s + 1}
\end{array}} \right]^{ - 1}}\left[ {\begin{array}{*{20}{c}}
0\\
1
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{{2s - 2}}{{{s^2} + s - 2}} = \frac{{2\left( {s - 1} \right)}}{{\left( {s + 2} \right)\left( {s - 1} \right)}} = \frac{2}{{s + 2}}
\end{array}\]注意到此時發生 pole-zero cancellation ($s=1$ 對消在右半面) !!
(c):
接著我們計算 unit-step response (注意到 unit-step 為 Bounded-input)
\[\begin{array}{l}
Y\left( s \right) = G\left( s \right)U\left( s \right) = \left( {\frac{2}{{s + 2}}} \right)\left( {\frac{1}{s}} \right) = \frac{2}{{s\left( {s + 2} \right)}} = \frac{1}{s} + \frac{{ - 1}}{{s + 2}}\\
\Rightarrow y\left( t \right) = 1 - {e^{ - 2t}}
\end{array}\]可發現系統輸出 $|y(t)| \le 1$ 亦即為 Bounded output。故系統為 BIBO 系統 under unit-step input。
8/29/2010
[線性系統] 對角化 與 Eigenvalues and Eigenvectors
首先我們給出相關定義
============================
Definition (Eigenvalue and Eigenvector)
設 $A$ 為 $n \times n$ 方陣,若存在一非零向量 $x \in \mathbb{R}^n$ (or $\in \mathbb{C}^n$) 與 純量 $\lambda \in \mathbb{R}^1$ (or $\in \mathbb{C}^1$)滿足
\[
Ax = \lambda x
\]則我們稱 $\lambda$ 為 $A$ 的 特徵值 (eigenvalue) 且 $x$ 為 $A$對應於 $\lambda $ 的特徵向量(eigenvector)。
============================
現在考慮 LTI 系統 (但無考慮外力 $u=0$) 以狀態空間表示
\[
\dot {x} = Ax,
\]其中 $x$ 為 $n \times 1$ 狀態向量,$A$ 為 $n \times n$ 常數矩陣。現在對上式取拉式轉換 且令初值為零,
\[sX\left( s \right) = AX\left( s \right) \Rightarrow \left( {sI - A} \right)X\left( s \right) = 0
\] 亦即對上述系統而言,其解特徵方程 (characteristic polynomial) 可寫為
\[
\det( s I - A) =0
\]且 特徵方程式的根 即為 eigenvalue。
對角化 (Diagonalization)
考慮 $A$ 為 $n$ 階方陣 ,且 $A$ 與 一個 對角矩陣(diagonal matrix) $ \Lambda$ 相似 (亦即有相同的 eigenvalue),則稱此 $A$ 矩陣為可對角化 (diagonalizable);亦即存在一個 non-singular transformation matrix $T$ 使得
\[
\Lambda = T^{-1}AT
\]
FACT: 若 $n$ 階方陣 $A$ 為可對角化(Diagonalizable),則必須具備 $n$個線性獨立的 eigenvector。
Proof: omitted
NOTE: $n$個線性獨立的 eigenvector 具有 $n$ 個對應的 相異 eigenvalue
由於矩陣的對角化可借助 eigenvalue 與 eigenvector 來達成,且依照 eigenvalue 的不同情況(共有三種情況)會有所各自不同的衍生討論,我們將各種情況總結如下:
以下我們逐項討論:
Case I: 相異特徵值 (Distinct eigenvalues)
考慮 $A$ 為 $n \times n$ 方陣,其特性方程
\[
\det(\lambda_iI - A) =0, \; \forall i
\]且 $\lambda_1 \neq \lambda_2 \neq ... \neq \lambda_n$。那麼對於 第 i 個 eigenvalue $\lambda_i$而言,其對應的 eigenvector 定為 $v_i$,且滿足 eigenvalue-eigenvector 關係
\[({\lambda _i}I - A){v_i} = 0\]那麼對任意 $i$ 而言,我們有
\[({\lambda _i}I - A){v_i} = 0 \Rightarrow {\lambda _i}{v_i} = A{v_i}\]亦即
\[ \Rightarrow \left\{ \begin{array}{l}
{\lambda _1}{v_1} = A{v_1}\\
{\lambda _2}{v_2} = A{v_2}\\
\vdots \\
{\lambda _n}{v_n} = A{v_n}
\end{array} \right.
\]現在將上述結果寫成矩陣形式:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}{v_1}}&{{\lambda _2}{v_2}}& \cdots &{{\lambda _n}{v_n}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{A{v_1}}&{A{v_2}}& \cdots &{A{v_n}}
\end{array}} \right]}\\
{ \Rightarrow \underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}\underbrace {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
\vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}_{n \times n} = A\underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}}
\end{array}\]令 $T: = \left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]$ 且
\[
\Lambda := {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
\vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}
\]則我們有
\[\begin{array}{l}
T\Lambda = AT \Rightarrow \Lambda = {T^{ - 1}}AT
\end{array}\]若 $T$ 為 nonsingular (i.e., $T$ 有 $n$ 個線性獨立的 row or columns 亦即 eigenvectors 之間彼此線性獨立)。
那麼現在我們證明 $T$ 確實為 nonsingular matrix。
Proof
用歸納法:令 $n=2$ 對任意兩個 eigenvector $v_i, v_j$ 而言,我們要證明此兩者為線性獨立,亦即由線性獨立的定義,對下式
\[
\alpha_i v_i + \alpha_j v_j =0 \ \ \ \ (*)
\]其係數 $\alpha_i = \alpha_j =0$。
故現在觀察 $(*)$ 式,兩邊同乘 $(\lambda_i I - A)$
\[\begin{array}{l}
{\alpha _i}\underbrace {({\lambda _i}I - A){v_i}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} + {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - A - {\lambda _j}I + {\lambda _j}I){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - {\lambda _j}I + \left( {{\lambda _j}I - A} \right)){v_j} = 0\\
\Rightarrow {\alpha _j}\left( {{\lambda _i}I - {\lambda _j}I} \right){v_j} + \underbrace {{\alpha _j}\left( {{\lambda _j}I - A} \right){v_j}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} = 0\\
\Rightarrow {\alpha _j}\left[ {\left( {{\lambda _i} - {\lambda _j}} \right)I} \right]{v_j} = 0
\end{array}\]又因為 $\lambda_i \neq \lambda_j$ (因為我們假設相異特徵值),且特徵向量 $ v_j \neq 0$ 故必然 $\alpha_j = 0$。
同理可推至 $n$個情況,這邊留給讀者自行證明。 $\square$
透過以上討論我們知道對相異 eigenvalue的情況必定存在 nonsingular matrix $T$ 使得 $A$ 可被對角化 (亦即由 彼此線性獨立 eigenvector 建構 $T$ 矩陣),但若我們有矩陣並不具有 $n$ 個獨立 eigenvector 該怎麼辦呢? 這個情況將會發生在 $A$ 矩陣有重根的時候:
Case II: 重複特徵值 (Repeated eigenvalues)
考慮矩陣 $A$ 為 $n \times n$ 矩陣且具有 $m$ 個重複特徵值,亦即
\[
\lambda_1 = \lambda_2 = ... = \lambda_m
\]那麼這些重複的特徵值仍必須滿足特徵方程,亦即我們有
\[
\det(\lambda_m I - A) =0
\]且由於出現重根,在此情況下我們不再具有 $n$ 個線性獨立的 eigenvectors;故我們想知道到底剩下幾個 eigenvector 仍是線性獨立,故我們計算 rank: 若
\[
\text{rank}\{ \lambda_m I - A\} =i
\] 則 我們具有 $n -i$ 個 對應於 $\lambda_m$ 的線性獨立 eigenvectors。
重根的情況其實頗為複雜,現在我們看一些例子:
Example 1
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&0\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,且 $\text{rank} \{\lambda_m I - A \} =0$ 故此三重根 $\lambda_m$ 會對應 $3 - 0 = 3$ 個各自獨立的 eigenvectors。
Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 1$ 故此三重根 $\lambda_m$ 會對應 $3 - 1 = 2$ 個各自獨立的 eigenvectors。
Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&1&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 2$故此三重根 $\lambda_m$ 會對應 $3 - 2 = 1$ 個各自獨立的 eigenvectors。
那麼當矩陣 $A$ 不具備足夠的線性獨立 eigenvector 時,我們需引入新的概念,稱作廣義特徵向量(Generalized eigenvector)。且 eigenvector 與 generalized eigenvector 可以建構一個
non-singular matrix $T$ 使得 $J:= T^{-1}AT$ 且我們稱此 $J$ 矩陣為 Jordan matrix。
=============================
Definition: Generalized eigenvector
我們稱向量 $v$ 為 矩陣 $A$ 對應於 eigenvalue, $\lambda$ 的 rank $k$ 廣義特徵向量(generalized eigenvector) 若下列條件成立
\[\left\{ \begin{array}{l}
{\left( {\lambda I - A} \right)^k}v = 0\\
{\left( {\lambda I - A} \right)^{k - 1}}v \ne 0
\end{array} \right.
\]其中 $k$ 為矩陣 $A$ 的重根數目
=============================
{{\lambda _1} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right];{\lambda _2} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{0}}\\
{\rm{1}}\\
{\rm{0}}
\end{array}} \right]}\\
{{\lambda _3} = 2 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{5}}\\
{\rm{3}}\\
{\rm{1}}
\end{array}} \right]}
\end{array}} \right.\]故其 nonsingular transformation matrix
\[T = \left[ {\begin{array}{*{20}{c}}
1&0&5\\
0&1&3\\
0&0&1
\end{array}} \right]\]
Jordan matrix
\[
J = T^{-1} A T =\left[ {\begin{array}{*{20}{c}}
1&1&0\\
0&1&0\\
0&0&2
\end{array}} \right]
\]
Case III: Complex eigenvalues
考慮 $A$ 為 $2 \times 2$ 方陣,其特性方程滿足
\[
\det(\lambda_i - A) = 0
\]且 eigenvalue $\lambda = \sigma + j \omega$ 為 complex number 。
由上述可知 eigenvalue-eigenvector 關係
\[
(\lambda I - A) v_i =0
\] eigenvalue 為 complex value,其對應的 eigenvector $v_i$ 亦為 complex vector。
Example
考慮矩陣
\[A = \left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\]$a,b \in \mathbb{R}, b \ne 0$。則我們可對此矩陣先求 eigenvalue,利用特性方程式可知
\[\begin{array}{l}
\det \left( {\lambda I - A} \right) = 0 \Rightarrow \det \left( {\left[ {\begin{array}{*{20}{c}}
{\lambda - a}&{ - b}\\
b&{\lambda - a}
\end{array}} \right]} \right) = 0\\
\Rightarrow {\left( {\lambda - a} \right)^2} + {b^2} = 0\\
\Rightarrow {\lambda ^2} - 2a\lambda + \left( {{a^2} + {b^2}} \right) = 0\\
\Rightarrow \lambda = a \pm jb
\end{array}\]現在我們求對應的 eigenvectors:
對 ${\lambda _1} = a + jb$ 我們可計算其 eigenvector 為
\[\begin{array}{l}
\left( {{\lambda _1}I - A} \right){v_1} = 0 \Rightarrow \left( {\left( {a + jb} \right)I - A} \right){v_1} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a + jb} \right) - a}&{ - b}\\
b&{\left( {a + jb} \right) - a}
\end{array}} \right]{v_1} = 0\\
\Rightarrow b\left[ {\begin{array}{*{20}{c}}
j&{ - 1}\\
1&j
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
\Rightarrow \left\{ \begin{array}{l}
j{v_{11}} - {v_{12}} = 0\\
{v_{11}} + j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
1\\
j
\end{array}} \right]
\end{array}\]
接著對 ${\lambda _2} = a - jb$
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} = 0 \Rightarrow \left( {\left( {a - jb} \right)I - A} \right){v_2} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a - jb} \right) - a}&{ - b}\\
b&{\left( {a - jb} \right) - a}
\end{array}} \right]{v_2} = 0\\
\Rightarrow b\left[ {\begin{array}{*{20}{c}}
{ - j}&{ - 1}\\
1&{ - j}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
\Rightarrow \left\{ \begin{array}{l}
- j{v_{11}} - {v_{12}} = 0\\
{v_{11}} - j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
j\\
1
\end{array}} \right]
\end{array}\]故 nonsingular transformation matrix $T$ 為
\[T = \left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\]且
\[\begin{array}{l}
{T^{ - 1}}AT = {\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]^{ - 1}}\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right] = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{a + bj}&{aj + b}\\
{ - b + aj}&{ - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{\left( {a + bj} \right) - j\left( { - b + aj} \right)}&{aj + b - j\left( { - bj + a} \right)}\\
{ - j\left( {a + bj} \right) - b + aj}&{ - j\left( {aj + b} \right) - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{2a + 2jb}&0\\
0&{2a - 2jb}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{a + jb}&0\\
0&{a - jb}
\end{array}} \right]
\end{array}\]
============================
Definition (Eigenvalue and Eigenvector)
設 $A$ 為 $n \times n$ 方陣,若存在一非零向量 $x \in \mathbb{R}^n$ (or $\in \mathbb{C}^n$) 與 純量 $\lambda \in \mathbb{R}^1$ (or $\in \mathbb{C}^1$)滿足
\[
Ax = \lambda x
\]則我們稱 $\lambda$ 為 $A$ 的 特徵值 (eigenvalue) 且 $x$ 為 $A$對應於 $\lambda $ 的特徵向量(eigenvector)。
============================
Comments:
1. 上述定義中 $Ax = \lambda x$ 又稱 eigenvalue-eigenvector 關係: $( \lambda I - A)x =0$,注意! $0$ 為 零向量!!。
2. 若 $A$ 為 $n \times n$ 方陣,則我們稱下式
2. 若 $A$ 為 $n \times n$ 方陣,則我們稱下式
\[\det (\lambda I - A)\]為 $A$ 矩陣的 特徵多項式(characteristic polynomial) 且 $\det(\lambda I -A)=0$ 為特徵方程(characteristic equation)。
\[
\dot {x} = Ax,
\]其中 $x$ 為 $n \times 1$ 狀態向量,$A$ 為 $n \times n$ 常數矩陣。現在對上式取拉式轉換 且令初值為零,
\[sX\left( s \right) = AX\left( s \right) \Rightarrow \left( {sI - A} \right)X\left( s \right) = 0
\] 亦即對上述系統而言,其解特徵方程 (characteristic polynomial) 可寫為
\[
\det( s I - A) =0
\]且 特徵方程式的根 即為 eigenvalue。
對角化 (Diagonalization)
考慮 $A$ 為 $n$ 階方陣 ,且 $A$ 與 一個 對角矩陣(diagonal matrix) $ \Lambda$ 相似 (亦即有相同的 eigenvalue),則稱此 $A$ 矩陣為可對角化 (diagonalizable);亦即存在一個 non-singular transformation matrix $T$ 使得
\[
\Lambda = T^{-1}AT
\]
FACT: 若 $n$ 階方陣 $A$ 為可對角化(Diagonalizable),則必須具備 $n$個線性獨立的 eigenvector。
Proof: omitted
NOTE: $n$個線性獨立的 eigenvector 具有 $n$ 個對應的 相異 eigenvalue
由於矩陣的對角化可借助 eigenvalue 與 eigenvector 來達成,且依照 eigenvalue 的不同情況(共有三種情況)會有所各自不同的衍生討論,我們將各種情況總結如下:
- 矩陣 $A$ 具有 相異特徵值 (distinct eigenvalues)
- 矩陣 $A$ 具有 重複特徵值 (repeated eigenvalues)
- 矩陣 $A$ 具有 複數特徵值 (complex eigenvalues)
以下我們逐項討論:
Case I: 相異特徵值 (Distinct eigenvalues)
考慮 $A$ 為 $n \times n$ 方陣,其特性方程
\[
\det(\lambda_iI - A) =0, \; \forall i
\]且 $\lambda_1 \neq \lambda_2 \neq ... \neq \lambda_n$。那麼對於 第 i 個 eigenvalue $\lambda_i$而言,其對應的 eigenvector 定為 $v_i$,且滿足 eigenvalue-eigenvector 關係
\[({\lambda _i}I - A){v_i} = 0\]那麼對任意 $i$ 而言,我們有
\[({\lambda _i}I - A){v_i} = 0 \Rightarrow {\lambda _i}{v_i} = A{v_i}\]亦即
\[ \Rightarrow \left\{ \begin{array}{l}
{\lambda _1}{v_1} = A{v_1}\\
{\lambda _2}{v_2} = A{v_2}\\
\vdots \\
{\lambda _n}{v_n} = A{v_n}
\end{array} \right.
\]現在將上述結果寫成矩陣形式:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}{v_1}}&{{\lambda _2}{v_2}}& \cdots &{{\lambda _n}{v_n}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{A{v_1}}&{A{v_2}}& \cdots &{A{v_n}}
\end{array}} \right]}\\
{ \Rightarrow \underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}\underbrace {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
\vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}_{n \times n} = A\underbrace {\left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]}_{n \times n}}
\end{array}\]令 $T: = \left[ {\begin{array}{*{20}{c}}
{{v_1}}&{{v_2}}& \cdots &{{v_n}}
\end{array}} \right]$ 且
\[
\Lambda := {\left[ {\begin{array}{*{20}{c}}
{{\lambda _1}}&0& \cdots &0\\
0&{{\lambda _2}}&{}& \vdots \\
\vdots &{}& \ddots &0\\
0& \cdots &0&{{\lambda _n}}
\end{array}} \right]}
\]則我們有
\[\begin{array}{l}
T\Lambda = AT \Rightarrow \Lambda = {T^{ - 1}}AT
\end{array}\]若 $T$ 為 nonsingular (i.e., $T$ 有 $n$ 個線性獨立的 row or columns 亦即 eigenvectors 之間彼此線性獨立)。
那麼現在我們證明 $T$ 確實為 nonsingular matrix。
Proof
用歸納法:令 $n=2$ 對任意兩個 eigenvector $v_i, v_j$ 而言,我們要證明此兩者為線性獨立,亦即由線性獨立的定義,對下式
\[
\alpha_i v_i + \alpha_j v_j =0 \ \ \ \ (*)
\]其係數 $\alpha_i = \alpha_j =0$。
故現在觀察 $(*)$ 式,兩邊同乘 $(\lambda_i I - A)$
\[\begin{array}{l}
{\alpha _i}\underbrace {({\lambda _i}I - A){v_i}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} + {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - A){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - A - {\lambda _j}I + {\lambda _j}I){v_j} = 0\\
\Rightarrow {\alpha _j}({\lambda _i}I - {\lambda _j}I + \left( {{\lambda _j}I - A} \right)){v_j} = 0\\
\Rightarrow {\alpha _j}\left( {{\lambda _i}I - {\lambda _j}I} \right){v_j} + \underbrace {{\alpha _j}\left( {{\lambda _j}I - A} \right){v_j}}_{ = 0\begin{array}{*{20}{c}}
{}
\end{array}by\begin{array}{*{20}{c}}
{}
\end{array}def.} = 0\\
\Rightarrow {\alpha _j}\left[ {\left( {{\lambda _i} - {\lambda _j}} \right)I} \right]{v_j} = 0
\end{array}\]又因為 $\lambda_i \neq \lambda_j$ (因為我們假設相異特徵值),且特徵向量 $ v_j \neq 0$ 故必然 $\alpha_j = 0$。
同理可推至 $n$個情況,這邊留給讀者自行證明。 $\square$
透過以上討論我們知道對相異 eigenvalue的情況必定存在 nonsingular matrix $T$ 使得 $A$ 可被對角化 (亦即由 彼此線性獨立 eigenvector 建構 $T$ 矩陣),但若我們有矩陣並不具有 $n$ 個獨立 eigenvector 該怎麼辦呢? 這個情況將會發生在 $A$ 矩陣有重根的時候:
Case II: 重複特徵值 (Repeated eigenvalues)
考慮矩陣 $A$ 為 $n \times n$ 矩陣且具有 $m$ 個重複特徵值,亦即
\[
\lambda_1 = \lambda_2 = ... = \lambda_m
\]那麼這些重複的特徵值仍必須滿足特徵方程,亦即我們有
\[
\det(\lambda_m I - A) =0
\]且由於出現重根,在此情況下我們不再具有 $n$ 個線性獨立的 eigenvectors;故我們想知道到底剩下幾個 eigenvector 仍是線性獨立,故我們計算 rank: 若
\[
\text{rank}\{ \lambda_m I - A\} =i
\] 則 我們具有 $n -i$ 個 對應於 $\lambda_m$ 的線性獨立 eigenvectors。
重根的情況其實頗為複雜,現在我們看一些例子:
Example 1
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&0\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,且 $\text{rank} \{\lambda_m I - A \} =0$ 故此三重根 $\lambda_m$ 會對應 $3 - 0 = 3$ 個各自獨立的 eigenvectors。
Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&0&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 1$ 故此三重根 $\lambda_m$ 會對應 $3 - 1 = 2$ 個各自獨立的 eigenvectors。
Example 2
\[A: = \left[ {\begin{array}{*{20}{c}}
{{\lambda _m}}&1&0\\
0&{{\lambda _m}}&1\\
0&0&{{\lambda _m}}
\end{array}} \right]\]此時 $A$ 矩陣具有三重根 $\lambda_m$ ,但 $\text{rank} \{\lambda_m I - A \} = 2$故此三重根 $\lambda_m$ 會對應 $3 - 2 = 1$ 個各自獨立的 eigenvectors。
那麼當矩陣 $A$ 不具備足夠的線性獨立 eigenvector 時,我們需引入新的概念,稱作廣義特徵向量(Generalized eigenvector)。且 eigenvector 與 generalized eigenvector 可以建構一個
non-singular matrix $T$ 使得 $J:= T^{-1}AT$ 且我們稱此 $J$ 矩陣為 Jordan matrix。
=============================
Definition: Generalized eigenvector
我們稱向量 $v$ 為 矩陣 $A$ 對應於 eigenvalue, $\lambda$ 的 rank $k$ 廣義特徵向量(generalized eigenvector) 若下列條件成立
\[\left\{ \begin{array}{l}
{\left( {\lambda I - A} \right)^k}v = 0\\
{\left( {\lambda I - A} \right)^{k - 1}}v \ne 0
\end{array} \right.
\]其中 $k$ 為矩陣 $A$ 的重根數目
=============================
NOTE: $k=1$ 即為原本的 eigenvalue 與 eigenvector。 (無重根)
Example
試求 $A$ 矩陣的 Jordan matrix 。
\[A = \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]
\]
Solution
首先求解 $A$ 矩陣對應的 eigenvalue:注意由於此矩陣為上三角矩陣,eigenvalue 直接就是對角線元素。或者讀者亦可由特徵方程 $\det(\lambda I - A) =0$ 可解得 $\lambda_i = 1,1,2, \;\; i=1,2,3$ (雙重根 $\lambda_1 = \lambda_2 = 1$)。
我們可先計算單根 $\lambda_3 = 2$ 部分對應的 eigenvector :由 eigenvalue-eigenvector 關係
\[\begin{array}{l}
\left( {{\lambda _3}I - A} \right){v_3} = 0\\
\Rightarrow \left( {2\left[ {\begin{array}{*{20}{c}}
1&0&0\\
0&1&0\\
0&0&1
\end{array}} \right] - \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]} \right){v_3} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
1&{ - 1}&{ - 2}\\
0&1&{ - 3}\\
0&0&0
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
5\\
3\\
1
\end{array}} \right]
\end{array}\]接著我們回頭對付重根 $( \lambda_1 = \lambda_2 = 1)$,先計算 $\text{rank}\{ \lambda_1 I - A\} = \text{rank}\{ \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right] = 2 \}$ 故重根對應的線性獨立 eigenvector 數目為 $3 - 2 = 1$。我們先求此 eigenvector:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = 0}\\
{ \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{ - {v_{12}} - 2{v_{13}} = 0}\\
{ - 3{v_{13}} = 0}\\
{ - {v_{13}} = 0}
\end{array}} \right. \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{{v_{12}} = 0}\\
{{v_{13}} = 0}
\end{array}} \right.}
\end{array}\]三個未知數,兩條方程式,故 $v_{11}$ 為自由變數,令 $v_{11} =1 $ 可得 $\lambda_m$ 對應的一組 eigenvector 為
\[\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right]\]接著我們利用此eigenvector 產生 generalized eigenvector 且滿足
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} = - {v_1}\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] = - \left[ {\begin{array}{*{20}{c}}
1\\
0\\
0
\end{array}} \right]\\
\Rightarrow \left\{ \begin{array}{l}
- {v_{22}} - 2{v_{23}} = - 1\\
{v_{23}} = 0
\end{array} \right. \Rightarrow \left\{ \begin{array}{l}
{v_{22}} = 1\\
{v_{23}} = 0
\end{array} \right.
\end{array}\]故我們選 $v_{22} = 1$ 亦即
\[\left\{ {\begin{array}{*{20}{l}}Example
試求 $A$ 矩陣的 Jordan matrix 。
\[A = \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]
\]
Solution
首先求解 $A$ 矩陣對應的 eigenvalue:注意由於此矩陣為上三角矩陣,eigenvalue 直接就是對角線元素。或者讀者亦可由特徵方程 $\det(\lambda I - A) =0$ 可解得 $\lambda_i = 1,1,2, \;\; i=1,2,3$ (雙重根 $\lambda_1 = \lambda_2 = 1$)。
我們可先計算單根 $\lambda_3 = 2$ 部分對應的 eigenvector :由 eigenvalue-eigenvector 關係
\[\begin{array}{l}
\left( {{\lambda _3}I - A} \right){v_3} = 0\\
\Rightarrow \left( {2\left[ {\begin{array}{*{20}{c}}
1&0&0\\
0&1&0\\
0&0&1
\end{array}} \right] - \left[ {\begin{array}{*{20}{c}}
1&1&2\\
0&1&3\\
0&0&2
\end{array}} \right]} \right){v_3} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
1&{ - 1}&{ - 2}\\
0&1&{ - 3}\\
0&0&0
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{31}}}\\
{{v_{32}}}\\
{{v_{33}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
5\\
3\\
1
\end{array}} \right]
\end{array}\]接著我們回頭對付重根 $( \lambda_1 = \lambda_2 = 1)$,先計算 $\text{rank}\{ \lambda_1 I - A\} = \text{rank}\{ \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right] = 2 \}$ 故重根對應的線性獨立 eigenvector 數目為 $3 - 2 = 1$。我們先求此 eigenvector:
\[\begin{array}{*{20}{l}}
{\left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = 0}\\
{ \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{ - {v_{12}} - 2{v_{13}} = 0}\\
{ - 3{v_{13}} = 0}\\
{ - {v_{13}} = 0}
\end{array}} \right. \Rightarrow \left\{ {\begin{array}{*{20}{l}}
{{v_{12}} = 0}\\
{{v_{13}} = 0}
\end{array}} \right.}
\end{array}\]三個未知數,兩條方程式,故 $v_{11}$ 為自由變數,令 $v_{11} =1 $ 可得 $\lambda_m$ 對應的一組 eigenvector 為
\[\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right]\]接著我們利用此eigenvector 產生 generalized eigenvector 且滿足
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} = - {v_1}\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
0&{ - 1}&{ - 2}\\
0&0&{ - 3}\\
0&0&{ - 1}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] = - \left[ {\begin{array}{*{20}{c}}
1\\
0\\
0
\end{array}} \right]\\
\Rightarrow \left\{ \begin{array}{l}
- {v_{22}} - 2{v_{23}} = - 1\\
{v_{23}} = 0
\end{array} \right. \Rightarrow \left\{ \begin{array}{l}
{v_{22}} = 1\\
{v_{23}} = 0
\end{array} \right.
\end{array}\]故我們選 $v_{22} = 1$ 亦即
{{\lambda _1} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{1}}\\
{\rm{0}}\\
{\rm{0}}
\end{array}} \right];{\lambda _2} = 1 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{21}}}\\
{{v_{22}}}\\
{{v_{23}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{0}}\\
{\rm{1}}\\
{\rm{0}}
\end{array}} \right]}\\
{{\lambda _3} = 2 \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}\\
{{v_{13}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{\rm{5}}\\
{\rm{3}}\\
{\rm{1}}
\end{array}} \right]}
\end{array}} \right.\]故其 nonsingular transformation matrix
\[T = \left[ {\begin{array}{*{20}{c}}
1&0&5\\
0&1&3\\
0&0&1
\end{array}} \right]\]
Jordan matrix
\[
J = T^{-1} A T =\left[ {\begin{array}{*{20}{c}}
1&1&0\\
0&1&0\\
0&0&2
\end{array}} \right]
\]
Case III: Complex eigenvalues
考慮 $A$ 為 $2 \times 2$ 方陣,其特性方程滿足
\[
\det(\lambda_i - A) = 0
\]且 eigenvalue $\lambda = \sigma + j \omega$ 為 complex number 。
由上述可知 eigenvalue-eigenvector 關係
\[
(\lambda I - A) v_i =0
\] eigenvalue 為 complex value,其對應的 eigenvector $v_i$ 亦為 complex vector。
Example
考慮矩陣
\[A = \left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\]$a,b \in \mathbb{R}, b \ne 0$。則我們可對此矩陣先求 eigenvalue,利用特性方程式可知
\[\begin{array}{l}
\det \left( {\lambda I - A} \right) = 0 \Rightarrow \det \left( {\left[ {\begin{array}{*{20}{c}}
{\lambda - a}&{ - b}\\
b&{\lambda - a}
\end{array}} \right]} \right) = 0\\
\Rightarrow {\left( {\lambda - a} \right)^2} + {b^2} = 0\\
\Rightarrow {\lambda ^2} - 2a\lambda + \left( {{a^2} + {b^2}} \right) = 0\\
\Rightarrow \lambda = a \pm jb
\end{array}\]現在我們求對應的 eigenvectors:
對 ${\lambda _1} = a + jb$ 我們可計算其 eigenvector 為
\[\begin{array}{l}
\left( {{\lambda _1}I - A} \right){v_1} = 0 \Rightarrow \left( {\left( {a + jb} \right)I - A} \right){v_1} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a + jb} \right) - a}&{ - b}\\
b&{\left( {a + jb} \right) - a}
\end{array}} \right]{v_1} = 0\\
\Rightarrow b\left[ {\begin{array}{*{20}{c}}
j&{ - 1}\\
1&j
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
\Rightarrow \left\{ \begin{array}{l}
j{v_{11}} - {v_{12}} = 0\\
{v_{11}} + j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
1\\
j
\end{array}} \right]
\end{array}\]
接著對 ${\lambda _2} = a - jb$
\[\begin{array}{l}
\left( {{\lambda _2}I - A} \right){v_2} = 0 \Rightarrow \left( {\left( {a - jb} \right)I - A} \right){v_2} = 0\\
\Rightarrow \left[ {\begin{array}{*{20}{c}}
{\left( {a - jb} \right) - a}&{ - b}\\
b&{\left( {a - jb} \right) - a}
\end{array}} \right]{v_2} = 0\\
\Rightarrow b\left[ {\begin{array}{*{20}{c}}
{ - j}&{ - 1}\\
1&{ - j}
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = 0\\
\Rightarrow \left\{ \begin{array}{l}
- j{v_{11}} - {v_{12}} = 0\\
{v_{11}} - j{v_{12}} = 0
\end{array} \right. \Rightarrow \left[ {\begin{array}{*{20}{c}}
{{v_{11}}}\\
{{v_{12}}}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
j\\
1
\end{array}} \right]
\end{array}\]故 nonsingular transformation matrix $T$ 為
\[T = \left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\]且
\[\begin{array}{l}
{T^{ - 1}}AT = {\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]^{ - 1}}\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right] = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
a&b\\
{ - b}&a
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
1&j\\
j&1
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
1&{ - j}\\
{ - j}&1
\end{array}} \right]\left[ {\begin{array}{*{20}{c}}
{a + bj}&{aj + b}\\
{ - b + aj}&{ - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{\left( {a + bj} \right) - j\left( { - b + aj} \right)}&{aj + b - j\left( { - bj + a} \right)}\\
{ - j\left( {a + bj} \right) - b + aj}&{ - j\left( {aj + b} \right) - bj + a}
\end{array}} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \frac{1}{2}\left[ {\begin{array}{*{20}{c}}
{2a + 2jb}&0\\
0&{2a - 2jb}
\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}
{a + jb}&0\\
0&{a - jb}
\end{array}} \right]
\end{array}\]
訂閱:
文章 (Atom)
[Claude] 國小數學加減乘除法計算小遊戲:數學怪獸大亂鬥
心血來潮用 Anthropic Claude Opus 4.6 做的簡單國小數學乘除法計算小遊戲,感嘆AI工具之強大與便利。原本可能要耗時幾天的工作轉眼就完成,時代的巨輪確實在飛速轉動。 數學怪獸大亂鬥(Math Monster Brawl)對戰的國小數學 加減乘除 小遊戲連結...
-
這次要介紹的是數學上一個重要的概念: Norm: 一般翻譯成 範數 (在英語中 norm 有規範的意思,比如我們說normalization就是把某種東西/物品/事件 做 正規化,也就是加上規範使其正常化),不過個人認為其實翻譯成 範數 也是看不懂的...這邊建議把 ...
-
數學上的 if and only if ( 此文不討論邏輯學中的 if and only if,只討論數學上的 if and only if。) 中文翻譯叫做 若且唯若 (or 當且僅當) , 記得當初剛接觸這個詞彙的時候,我是完全不明白到底是甚麼意思,查了翻譯也...
-
半導體中的電流是由電子(electron)及電洞(hole)兩種載子(carrier)移動所產生 載子移動的方式: 擴散(diffusion) $\Rightarrow$ 擴散電流 (不受外力電場作用) 飄移(drift) $\Rightarrow$ 飄移電流 (...


