(想要看算法的讀者建議直接閱讀 [最佳化理論] Conjugate Direction Methods (2) - The Conjugate Gradient Algorithm for Quadratic Objective function )
注意這邊我用 Method"s",表示所謂的Conjugate Direction Method有很多種。所以我們稱之為這一類。在介紹之前先說說這類 計算方法 有甚麼特色
- 對於 2階 具有n個變數的 目標函數 (Quadratic Objective function with n variables) 可以在 n步驟內求解。(也就是對二階目標函數收斂性很好 (求解的計算速度夠快) )
- 一般而言常用的 Conjugate Direction Gradient Algorithm 方法不需要計算 Hessian Matrix
- Conjugate Direction Methods 不須計算反矩陣
Comments:
上述的2階 具有n個變數的 目標函數 表示如下:
對 u∈Rn , Q 為 對稱 且 正定矩陣 Q=QT≻0 ,目標函數寫為
J(u)=12uTQu−uTb對 u∈Rn , Q 為 對稱 且 正定矩陣 Q=QT≻0 ,目標函數寫為
那麼現在我們來問問,什麼叫Conjugate Direction??
本質上來說就是他是一個 方向 (也就是向量 )! 具有共軛 (Conjugate) 的性質。所以我們得先知道什麼叫做 Conjugate;以下一組向量 d(0),d(1),...,d(m) 被稱作 Conjugate 的定義
-----------------
Definition: (Q-Conjugate)
令 Q 為一個 real symmetric n×n 矩陣。其方向 d(0),d(1),...,d(m) 稱作 Q-conjugate 如果下列條件成立:
∀i≠j, d(i)TQd(j)=0-----------------
知道這個Conjugate定義之後會問說要知道這個定義有甚麼用呢? 用處就是一旦有了Conjugate direction,則這些directions會彼此線性獨立。我們將此結果記做下面引理
-----------------
Lemma: (Q-Conjugate direction is linearly independent)
令 Q 為一個 對稱 且 正定 (symmetric and positive definite) n×n 矩陣。若 下列方向 d(0),d(1),...,d(n−1)∈Rn 為非零向量且 Q-conjugate ,則 這些方向互為線性獨立。
-----------------
Proof:
我們要證明 d(0),d(1),...,d(n−1) 互為線性獨立。由線性獨立定義,假設
n−1∑i=0αid(i)=0,必須證明 ∀αi=0
現在如果我們考慮對任意 αk 的情況,將上述summation同乘 d(k)TQ,可得
d(k)TQn−1∑i=0αid(i)=0⇒n−1∑i=0αid(k)TQd(i)=0 (∗)現在由於前提可知 d(0),d(1),...,d(n−1) 為 Q-conjugate,由Q-conjugate 定義可知 ∀i≠j, d(i)TQd(j)=0
故對所有的 i≠k, d(k)TQd(i)=0 ,亦即:
n−1∑i=0αid(k)TQd(i)=0;⇒αkd(k)TQd(k)=0又因為我們的前提告訴我們 Q 為一個 symmetric positive definite n×n 矩陣,且方向 d(0),d(1),...,d(n−1)∈Rn 為非零向量;
由正定矩陣定義: d(k)TQd(k)>0, ∀d(k)≠0。故可知
(∗)⇒αkd(k)TQd(k)⏟>0=0亦即
⇒αk=0現在由於 αk 為任意給定。故
n−1∑i=0αkd(k)=0, ∀αk=0即為所求。 ◻
ref: E. K. P. Chong, S. H. Zak, An Introduction to Optimization 2nd.
(∗)⇒αkd(k)TQd(k)⏟>0=0亦即
⇒αk=0現在由於 αk 為任意給定。故
n−1∑i=0αkd(k)=0, ∀αk=0即為所求。 ◻
ref: E. K. P. Chong, S. H. Zak, An Introduction to Optimization 2nd.
----
延伸閱讀
[最佳化理論] Conjugate Direction Methods (1) - Basic Algorithm for Quadratic Objective function
[最佳化理論] Conjugate Direction Methods (2) - The Conjugate Gradient Algorithm for Quadratic Objective function
延伸閱讀
[最佳化理論] Conjugate Direction Methods (1) - Basic Algorithm for Quadratic Objective function
[最佳化理論] Conjugate Direction Methods (2) - The Conjugate Gradient Algorithm for Quadratic Objective function
沒有留言:
張貼留言