Processing math: 38%

11/24/2009

[數學分析] 淺談有限維度空間的 Linear Transformation

這邊介紹 Rn 空間的 線性轉換 (Linear Transformation)

但我們首先從無窮維任意向量空間開始定義:

======================
X,Y 為任意 向量空間 (Vector Space):
Definition: Linear Transformation
我們稱 映射 A:XY 為 線性轉換 (Linear Transformation) 若下列條件成立:對任意 x,yX 與 純量 cR
A(x+y)=Ax+AyA(cx)=cAx======================

Comment:
1. 注意到上述符號: A(x) 表示 A 作用x 上!!  並非乘法一般而言,若 A 為 linear ,A(x) 會記為 Ax (讀者須避免與乘法造成誤會!)

2. 考慮 Linear transformation A:XY ,若 {x1,x2,...,xn}X 空間的 基底 (basis),則任意向量 xX 有唯一表示:
x=ni=1cixi且由 Linearity of A 可知
Ax=A(ni=1cixi)=ni=1ciAxi

======================
Definition: Linear Operator
Linear Transformation  A:XX 稱為 線性算子 (Linear Operator) 
======================

======================
Definition: Invertible Linear Operator
Linear Operator A:XXinvertible 若下列條件成立:
1. A 為 one-to-one;亦即 對任意 x1,x2X, x1x2Ax1Ax2
2. A 為 onto;亦即 對任意 yX 存在 xX 使得 Ax=x

若 Linear Operator A 為 invertible 則其 inverse 我們記做 A1 on X 且滿足
對任意 xXA1A(x)=x======================



現在我們看幾個結果:
======================
Theorem 1: 考慮 Linear Operator A:XXX 為 有限維度的 vector space。則 A 為 one-to-one 若且為若 A is onto。
======================
Proof: omitted


Comments/Notations:
1. 一般而言,我們定義 L(X,Y) 為一個集合,其中的元素為所有由 X 映射到 Y 的 Linear transformation 所組成。

2. L(X):=L(X,X)

3. Addition and Scalar multiplication of Linear Operators
A1,A2L(X,Y)c1,c2R,則對任意 xX,我們可以定義
(c1A1+c2A2)x:=c1A1xL(X,Y)+c2A2xL(X,Y)(c1A1+c2A2)xL(X,Y)

4. Composition of Linear Operators:
X,Y,Z 為 Vector Spaces 且若 AL(X,Y)BL(Y,Z) 則我們可以定義 composition of A and B : 對任意 xX
(BA)x=B(Ax)BAL(X,Z)

5. Operator Norms
考慮 AL(Rn,Rm) 則我們定義 Operator norm ||A||L 如下:對任意 xX
||A||L:=sup
且上述 Operator norm 滿足 ||A {\bf x}|| \le ||A||_L ||{\bf x}|| 對任意 {\bf x} \in X。(在不失一般性之下,我們通常將 operator norm ||A||_L 直接記做 ||A||。)
---


現在我們看以下幾個關於 operator norm 的衍生結果:
=================
FACT 1: A \in L(\mathbb{R}^n, \mathbb{R}^m)||A|| < \inftyA 為 uniformly continuous mapping。
=================

Proof:
A \in L(\mathbb{R}^n, \mathbb{R}^m),我們首先證明  ||A|| < \infty ;由定義可知
||A|| = ||A|{|_L}: = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}}|| \ \ \ \ (*) 現在令 \left\{ {{{\bf{e}}_1},...,{{\bf{e}}_n}} \right\}\mathbb{R}^n 空間的 standard basis,則可知任意 {\bf x} 可用上述的 standard basis 做唯一表示,故我們現在取 {\bf x} 滿足 ||{\bf x}|| =1 ;亦即我們可寫
{\bf{x}}: = \sum\limits_{i = 1}^n {{c_i}{{\bf{e}}_i}} |c_i| \le 1\; \forall i=1,...,n(*) 變成
\begin{array}{*{20}{l}} {||A|| = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}}|| = \mathop { }||A\sum\limits_{i = 1}^n {{c_i}{{\bf{e}}_i}} ||}\\ {\begin{array}{*{20}{c}} {}&{}&{}&{} \end{array} = ||\sum\limits_{i = 1}^n {{c_i}A{{\bf{e}}_i}} || \le \sum\limits_{i = 1}^n {\left\| {A{{\bf{e}}_i}} \right\|}  < \infty } \end{array}
接著我們證明 A 為 uniformly continuous,給定 \varepsilon>0 我們要證明 存在 \delta>0 使得 對任意 {\bf u,v} \in \mathbb{R}^n
||{\bf{u}} - {\bf{v}}|| < \delta  \Rightarrow ||A{\bf{u}} - A{\bf{v}}|| < \varepsilon
如果我們選 \delta < \varepsilon/||A|| 則我們有
||A{\bf{u}} - A{\bf{v}}|| = ||A\left( {{\bf{u}} - {\bf{v}}} \right)|| \le \underbrace {||A||}_{ < \infty } \cdot \underbrace {||{\bf{u}} - {\bf{v}}||}_{ < \frac{\varepsilon }{{||A||}}} < \varepsilon ||{\bf{u}} - {\bf{v}}|| < \delta 成立。亦即 A 為 uniformly continuous。\square



==================
FACT 2: A,B \in L(\mathbb{R}^n, \mathbb{R}^m)c 為 純量,則 operator norm 滿足
||A+B|| \le ||A|| + ||B||;\;\;\; ||c A|| = |c| ||A|| =================
Proof:
首先證明 operator norm 滿足 三角不等式 ||A+B|| \le ||A|| + ||B||;對任意 {\bf x} \in \mathbb{R}^n,觀察
\begin{array}{l} ||A + B|| = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||\left( {A + B} \right){\bf{x}}|| = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}} + B{\bf{x}}||\\ \begin{array}{*{20}{c}} {}&{}&{}&{} \end{array} \le \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}}|| + \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||B{\bf{x}}||\\ \begin{array}{*{20}{c}} {}&{}&{}&{} \end{array} \le ||A|| + ||B|| \end{array}
接著我們證明  ||c A|| = |c|\cdot ||A||;對任意 {\bf x} \in \mathbb{R}^n,觀察
\left| {\left| {c \cdot A} \right|} \right| = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||cA{\bf{x}}|| = \left| c \right|\mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}}|| = \left| c \right|\left| {\left| A \right|} \right| \ \ \ \ \square

==================
FACT 3: 考慮 A \in L(\mathbb{R}^n, \mathbb{R}^m)B \in L(\mathbb{R}^m, \mathbb{R}^k),則
||B \circ A|| \le ||B|| ||A|| =================
Proof: 
\begin{array}{l} |B \circ A|| = \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||B\left( {A{\bf{x}}} \right)|| \le \mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||B||||A{\bf{x}}||\\ \begin{array}{*{20}{c}} {}&{}&{}&{} \end{array} = ||B|| \cdot \underbrace {\mathop {\sup }\limits_{||{\bf{x}}|| = 1} ||A{\bf{x}}||}_{ = ||A||} = ||B|| \cdot ||A|| \end{array} \ \ \ \ \square


==================
FACT 4:  L(\mathbb{R}^n, \mathbb{R}^m) 配備 norm ||A-B||為 metric space。其中 A,B \in L(\mathbb{R}^n, \mathbb{R}^m)
 =================
Proof: omitted.


由於 FACT 4 ,我們知道 L(\mathbb{R}^n, \mathbb{R}^m) 為 metric space,故 topological 架構 (e.g., open, close, compactness,...)可以再其上被討論。

======================
Theorem 2: \Omega:=L(\mathbb{R}^n) 為 invertible linear operators 的集合,則
(a) 若 A \in \Omega, B \in L(\mathbb{R}^n)||B-A|| \cdot ||A^{-1}|| <1B \in \Omega
(b) \Omega \subset L(\mathbb{R}^n) 為 open 且 映射 A \to A^{-1} 為 continuous on \Omega
======================

Proof:
要證 B \in \Omega,亦即 B 為 invertible linear operators。 (由前述 Theorem 1 我們只需證 B 為 one-to-one 即可。) 現在令 ||A^{-1}|| := 1/\alpha||B-A|| := \beta 則 由 假設可知 ||B-A|| \cdot ||A^{-1}|| <1 \Rightarrow \beta < \alpha

現在觀察:對任意 {\bf x} \in \mathbb{R}^n 我們有
\alpha |{\bf{x}}| = \alpha |{A^{ - 1}}A{\bf{x}}| \le \alpha \left\| {{A^{ - 1}}} \right\||A{\bf{x}}| = |A{\bf{x}}|
\begin{array}{l} |A{\bf{x}}| = |A{\bf{x}} - B{\bf{x}} + B{\bf{x}}|\\ \begin{array}{*{20}{c}} {}&{}&{} \end{array} \le |\left( {A - B} \right){\bf{x}}| + |B{\bf{x}}|\\ \begin{array}{*{20}{c}} {}&{}&{} \end{array} \le \left\| {A - B} \right\||{\bf{x}}| + |B{\bf{x}}|\\ \begin{array}{*{20}{c}} {}&{}&{} \end{array} = \beta |{\bf{x}}| + |B{\bf{x}}| \end{array}將上述結果合併可推得
\begin{array}{l} \left\{ \begin{array}{l} \alpha |{\bf{x}}| \le |A{\bf{x}}|\\ |A{\bf{x}}| \le \beta |{\bf{x}}| + |B{\bf{x}}| \end{array} \right.\\  \Rightarrow \alpha |{\bf{x}}| \le \beta |{\bf{x}}| + |B{\bf{x}}|\\  \Rightarrow \left( {\alpha  - \beta } \right)|{\bf{x}}| \le |B{\bf{x}}| \ \ \ \ \ (*) \end{array} 注意到由於 \beta < \alpha 故可知若 {\bf x} \neq 0B{\bf{x}} \ne 0B 為 one-to-one。且因為 \mathbb{R}^n 為 finite-dimensional vector space,由 前述 Theorem 可知 B \in \Omega

接著我們證明 (b)

首先證明 \Omega 為 open,亦即給定 A \in \Omega 存在 \delta >0 使得 open ball B_\delta(A) \subset \Omega

觀察 open ball {B_\delta }(A): = \left\{ {B:\left\| {A - B} \right\| < \delta } \right\} 故若我們選 \delta := \alpha 亦即 選 \delta := 1/\left\| {{A^{ - 1}}} \right\| 即可。

我們接著證明 映射 A \to A^{-1} 為 continuous on \Omega
觀察
\begin{array}{l} \left\| {{B^{ - 1}} - {A^{ - 1}}} \right\| = \left\| {{B^{ - 1}}\left( {A - B} \right){A^{ - 1}}} \right\|\\ \begin{array}{*{20}{c}} {}&{}&{} \end{array} \le \left\| {{B^{ - 1}}} \right\|\left\| {A - B} \right\|\left\| {{A^{ - 1}}} \right\| \le \frac{{\left\| {{B^{ - 1}}} \right\|\beta }}{\alpha }  \ \ \ \ (\star) \end{array}再者我們回憶 (*): \left( {\alpha  - \beta } \right)|{\bf{x}}| \le |B{\bf{x}}|,現在若取 {\bf x} := B^{-1}{\bf y} 可得
\begin{array}{l} \left( {\alpha  - \beta } \right)|{\bf{x}}| \le |B{\bf{x}}|\\  \Rightarrow \left( {\alpha  - \beta } \right)|{B^{ - 1}}{\bf{y}}| \le |B{B^{ - 1}}{\bf{y}}|\\  \Rightarrow |{B^{ - 1}}{\bf{y}}| \le \frac{1}{{\alpha  - \beta }}|{\bf{y}}|\\  \Rightarrow \left\| {{B^{ - 1}}} \right\| \le \frac{1}{{\alpha  - \beta }} \end{array}(\star) 變成
\begin{array}{l} \left\| {{B^{ - 1}} - {A^{ - 1}}} \right\| \le \frac{{\left\| {{B^{ - 1}}} \right\|\beta }}{\alpha }\\ \begin{array}{*{20}{c}} {}&{}&{}&{}&{}&{}&{} \end{array} \le \frac{\beta }{{\left( {\alpha  - \beta } \right)\alpha }} \end{array}現在若我們讓 ||A-B|| \to 0 亦即  ||A - B|| \to 0 \Rightarrow \beta  \to 0
||A^{-1} - B^{-1}|| \to 0 亦即映射 A \to A^{-1} 為 continuous on \Omega


ref: W. Rudin, Principle of Mathematical Analysis, 3rd Edition.

沒有留言:

張貼留言

[人工智慧] 本地端 DeepSeek R1 快速安裝:以 Macbook Pro M4 Chip為例

最近火熱的 DeepSeek R1 模型由於採用了 distill 技術,可以大幅降低計算成本,使得一般人有機會在自家筆電上跑性能逼近 Open AI ChatGPT o1的大語言模型。本文簡單介紹一步安裝在 Macbook Pro 的方法以及使用方法,以下測試採用 Macboo...