為何要做線性化?
其實線性化的動機很簡單,主要是因為一般在分析動態系統的時候,大部分系統行為都是呈現非線性(EX: 電路系統(二極體 I/V curve),倒單擺、撓性機構、機器人、生物細胞、金融模型...),但這些非線性行為會有一個大的困難,就是難以直接求解其動態行為。且發展成熟的線性系統理論沒有辦法(有效的)應用在上面,但如果能夠透過一些假設/機制,我們可以把原本非線性的系統轉成線性系統,如此一來原本沒辦法使用的線性系統理論便可以派上用場!!
如何做線性化?
至於實際如何做到對任意 非線性函數 (e.g., $\sin, \cos, \exp, x^n$, ...)線性化呢? 簡單來說,就是採用切線 (微分) 的概念,如果我們對關心的某一點對該點取導數,則我們可以得到一條對該點的切線,此切線可以在某種程度上用來近似 該點附近的函數行為。
https://controls.engin.umich.edu/wiki/index.php/LinearizingODEs
----- 以下進入正題 ----
若用數學來描述非線性的系統可以寫成
\[
\dot x(t) = f(x)
\]其中 $x(t) \in \mathbb{R}^n$ 稱作系統狀態(state variable) (這邊考慮 $n$ 維空間,故有 $n$ 個系統狀態變數); $\dot x(t)$ 為系統狀態的一階導數; $f$ 為用以描述動態系統的任意函數
在此我們考慮系統狀態為 $n$ 階。意思就是有 $n$ 個不同的系統狀態,記做 $x \in \mathbb{R}^n$
在介紹線性化之前,我們得先介紹 "平衡點(equilibrium point)":
=====================
Definition: Equilibrium point
若 $f(\bar{x})=0$ ,則系統狀態 $\bar{x} \in \mathbb{R}^n$ 被稱作 平衡點(equilibrium point)。
=====================
Comments
由上述定義可以推知,如果 $x(0)=\bar{x}$ ,則 $x(t)=\bar{x}, \forall t \geq 0$ ;
也就是說一旦 在最一開始( $t=0$ )的時候,系統就處在平衡點的狀態,則對任意時刻 $t \geq 0$,系統狀態會持續處在平衡點的狀態。
====================
Definition: 穩定平衡點 (Stable equilibrium point)
平衡點若被稱為穩定的,或稱 穩定平衡點(stable equilibrium point),則其必須滿足 在任意時刻 之狀態 $x(t)$ 都需收斂到平衡點 $\bar{x}$,亦即
\[
x(t) \rightarrow \bar{x}
\]( $|| x(0)-\bar{x} ||$ 為足夠小 )
反之,若不收斂則稱為 不穩定的平衡點(unstable equilibrium) 其中
\[
|| x(0)-\bar{x} || := \left ( \displaystyle \sum_{i} (x_i(0)-\bar{x}_i)^2 \right )^{\frac{1}{2}}\] 為 2-norm
==================
Comments:
上述定義指明 所謂的 穩定平衡點是指 考慮 任意時刻的狀態 $x(t), \forall t$,若此狀態都會回到 某個平衡點 $\bar{x}$ 則我們說他是一個 穩定的平衡點。
在介紹完平衡點之後,我們便可介紹所謂的 線性化,誠如先前所說,線性化的基本概念是微分,所以在此我們會假設動態系統充分可微(smooth),故我們可以進行 泰勒展開 (微分近似)。
=================
線性化(Linearization):
注意:我們僅對 穩定平衡點 做線性化。(不穩定的平衡點亦可線性化只是實際用處不大)
現在我們回頭考慮 $n$ 階非線性系統
\[
\dot x(t) = f(x)
\]其系統狀態 $x(t)$ 可表為 平衡點狀態 $\bar{x}$ 加上 狀態(小擾動)增量( $\Delta x(t)$ );注意。在此我們假設擾動 $\Delta x$ 不能太大。
\[
x(t) = \bar{x} + \Delta x(t)
\]則我們可寫下
\[
f_1 (x) = f_1 (x+\Delta x)\]
若此 $f$ 為 平滑函數(smooth) (也就是說可以對其做泰勒展開),則我們可改寫上式如下:
對 $f_1$ 可寫出其泰勒展開式 (對 $0$ 點展開)
$\Rightarrow f_1(x) = f_1(\bar{x}) + \frac{\partial f_1}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_1}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$ ....(1)
同樣的,我們也可以對 $f_2...f_n$ 展開。
$\Rightarrow f_2(x) = f_2(\bar{x}) + \frac{\partial f_2}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_2}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T.$
$\vdots$
$\Rightarrow f_n(x) = f_n(\bar{x}) + \frac{\partial f_n}{\partial x_1}|_{x=\bar{x}} \Delta x_1 + ... + \frac{\partial f_n}{\partial x_n}|_{x=\bar{x}} \Delta x_n + H.O.T$
其中 $H.O.T$ 表示 高階項(Higher Order Terms)
然後因為增量 $\Delta x_1, \Delta x_2...$ 假設為很小的擾動,在高階項的影響可被忽略
現在,回憶我們手邊有的狀態
\[
x(t) = \bar{x} + \Delta x(t)\]
對上式兩邊對時間微分,可得
\[
\dot x(t) = \Delta \dot x(t)\]
再者,因為我們知道 系統為 $\dot x(t) = f(x)$, 由式 (1) 我們可以帶入泰勒展開到 $f(x)$ 之中,最後整理可得線性化之後的 增量(擾動)系統
\[
\Delta \dot x(t) = A \cdot \Delta x(t) \ \ \ \ (2) \]
\Delta \dot x(t) = A \cdot \Delta x(t) \ \ \ \ (2) \]
其中 $A$ 為矩陣其第 (i,j) 元素由下式表示
\[
a_{ij} = \frac{\partial f_i}{\partial x_j}|_{x=\bar{x}}\]
a_{ij} = \frac{\partial f_i}{\partial x_j}|_{x=\bar{x}}\]
上式 $(2)$ 即稱為 線性化後的動態系統。由於此為線性,故所有的線性系統理論 (eigenvalue, controllability, observability) 便可以在其上進行討論