Loading [MathJax]/jax/output/CommonHTML/jax.js

3/19/2014

[最佳化理論] Conjugate Direction Methods (1) - Basic Algorithm for Quadratic Objective function

再接續前面介紹過的 [最佳化理論] Conjugate Direction Methods (0) -Theory

這次我們要介紹 Basic Conjugate Direction Methods  對於 標準二階目標函數的應用。現在考慮下列標準 二階 具有 n 個變數的目標函數
J(u)=12uTQu+bTu+c 其中 Q=QT>0uRn

Comments:
注意到標準二階目標函數,我們知道 其真正的最佳解為何。 (why?)
由 一階必要條件 FONC: J(u)=0 可知
JT(u)=12[(Qu)T+uTQ]+bT=0因為 QT=Q ,上式可改寫
J(u)=Qu+b=0u=Q1b再者檢驗二階充分條件 SOSC (Hessian Condition): (2J(u)>0)

2J(u)=Q 又因為我們說  Q 為正定矩陣。故 2J(u)=Q>0; 亦即 u=Q1b 為 Strong Local minimum (在此例中, u=Q1b 亦為 Global minimum)。

------------------

對於上述的標準二階目標函數而言,Conjugate Direction Algorithm 設計如下

============================
Basic Conjugate Direction Algorithm

給定初始值 u(0) 與 Q-conjugate 方向 d(0),d(1),...,d(n1);對 k0

g(k)=J(u(k))=Qu(k)b

αk=g(k)Td(k)d(k)TQd(k)

u(k+1)=u(k)+αkd(k)
============================

回憶之前我們曾經提過 Conjugate Direction Method對標準二階 n變數的 目標函數可以在 n 步內找到最佳解。在此我們並不證明這個重要結果。只把它紀錄如下:

=============
Theorem: Quadratic Convergence Property
考慮  J(u)=12uTQu+bTu+c  其中 Q=QT>0uRn 。那麼對任意初始值 u(0) ,上述 Basic Conjugate Direction Algorithm 可以最多在 n 步收斂到最佳解 u=Q1b
=============
Proof: Omitted.

=============

至此我們知道了基本的Basic Conjugate Direction Algorithm,也知道其確實十分有效率 (至少對二階具有 n 個變數的目標函數 由前述定理可知 在 n 步之內收斂 );但問題是如果我們回頭檢查  Conjugate Direction Algorithm 會發現儘管有辦法給定初始值,其 Q-conjugate direction仍然未定。下一篇將會介紹 如何 在 跌代過程中順便把 Conjugate direction 也產生出來的演算法 (此法稱作 Conjugate Gradient Method )。

ref: E. K. P. Chong, S. H. Zak, An Introduction to Optimization 2nd.

====
延伸閱讀

[最佳化理論] Conjugate Direction Methods (2) - The Conjugate Gradient Algorithm for Quadratic Objective function

沒有留言:

張貼留言

[人工智慧] 本地端 DeepSeek R1 快速安裝:以 Macbook Pro M4 Chip為例

最近火熱的 DeepSeek R1 模型由於採用了 distill 技術,可以大幅降低計算成本,使得一般人有機會在自家筆電上跑性能逼近 Open AI ChatGPT o1的大語言模型。本文簡單介紹一步安裝在 Macbook Pro 的方法以及使用方法,以下測試採用 Macboo...