謝宗翰的隨筆

5/11/2011

[衍生商品] 希臘值與動態避險 (1)-Delta Hedging Example

回憶前篇 [衍生商品] 希臘值與動態避險 (0) - Delta and Delta Neutral ，這次要介紹如何利用 $\Delta$ 進行動態避險。

回憶 $\Delta$ 定義如下：
\[
\Delta := \frac{\partial f}{ \partial S}
\]亦即表示為選擇權價格 $f$ 對股價 $S$ 的變化率。(由於其為一階導數，故為斜率)

現在來看個例子：

Example 1 : (Delta Hedging)

如果 $\Delta = 0.6$ 則表示當股價些微變化的時候，對應的選擇權價格變化大約是股價變化值的 $60 \%$。
下圖顯示了一組 $\Delta$ 值在某時刻的例子：

考慮上圖，假設股價為 $\$ 100 $，Call option 價格為 $ c= \$ 10$，現在考慮某金融機構的交易員賣出了 $20$ 份 Call option (一份選擇權對應其持有者可以有權購買 $100$ 股，亦即 $20$ 份call option 共 $x= 20 \times 100 = 2000$ 股)。此時如果不進行避險，則當股價上升時，該交易員會暴露風險之中：

簡單的說，現在有兩個人物：

賣出 call option 的交易員
跟交易員購買 call option 的客戶

此時客戶的 $\Delta_{Customer} =0.6$ (因為購入call option，當股價上升對顧客有利，此時 $\Delta >0$)
而交易員的 $\Delta_{trader} = -0.6$， (由於交易員是 "賣出" 選擇權，故當股票價格上升，則選擇權會被執行，此情形時將對交易員產生風險。故此 $\Delta$ 對交易員而言是負值)

現在，站在交易員的觀點，如果不進行避險，則交易員本身的潛在損失為
\[
-0.6 \times 2000 =-1200 \ \text{shares}
\]
我們必須消除賣出 Call option所帶來的風險，此時交易員可進行 $\Delta$-Hedging 來補足缺少的 $1200$ 股股票。：

由於交易員是 "賣出" Call option ，故避險方法便是進行反向操作，也就是可以透過 "買入" 一定量股票來抵銷當股價上升時，Call option 被執行所帶來的損失風險，故
購買 $\Delta \times x = 0.6 \times 2000 =1200$ 股股票

此時如果股票上漲 $1$ 元，則交易員買入的股票會上升 $1200$ 元 (賺 $1200$ 元)，而由圖中 $\Delta =0.6$ 可知 Call option 會上漲 $0.6$ 元，故如果此時 Call option 被持有者執行，則交易員會損失 $0.6 \times 2000 = \$ 1200$ 此數值剛好會跟交易員進行避險時候買入的股票所賺取的 $1200$ 抵銷。

相反的如果股票下跌 $1$元，則交易員買入的股票會下跌 $1200$ 元 (損失 $1200$ 元)，而由圖中 $\Delta =0.6$ 可知 Call option 亦會下跌 $0.6$ 元，此時選擇權不會被執行，則交易員因為賣出選擇權會賺得 $ \$ 1200$ 此數值剛好會跟交易員進行避險時候賣出的股票所損失的 $1200$ 抵銷。 $\square$

Comment:
1. 注意到上述例子中，由於 $\Delta$ 會變動，故抵銷後的 $\Delta$-Hedging 只能維持一段極短時間，也就是需要不斷的調整 $\Delta$-Hedging ，此稱為 Rebalancing。一般而言，隨時間不斷調整的避險策略統稱為 $Dynamic Hedging$，這邊展示的是利用 $\Delta$ 進行避險

2. $\Delta$ 在 Nondividend Black-Scholes formula 中等價為 $N(d_1)$；亦即
\[
\Delta := \frac{{\partial f}}{{\partial S}} = N\left( {{d_1}} \right)
\] 其中 $N(\cdot)$ 為 Cumulative normal distribution。

3. $\Delta$ -Hedging 並非 Perfect Hedging。(WHY!? 理由同 comment 1 )

Example 2 (Delta-Hedging )
考慮造市商(market-maker) 賣出 $K=40$ 的 call-option on 100 股股票，且
$ \sigma=0.3$, $r=0.08 $ 連續複利
現在考慮 Day 0，$S=\$40$, $c =\$2.78$, $\Delta=0.58$
如何進行 $\Delta$-hedging?
How much cost you to create such a $\Delta$-hedging ?

現在再考慮 Day 1，$S=40.5, c= \$ 3.06$, $\Delta=0.61$
如何進行 $\Delta$-hedging?
Overnight Mark-to-market profit/loss ?

現在再考慮 Day 2，$S=39.25, c= \$2.328$, $\Delta=0.53$
Overnight Mark-to-market profit/loss ?

Solution:
考慮時刻為 DAY 0
首先考慮不進行避險情況，market-maker 本身為 $-\Delta \times 100 = -58$，故需要補足此 $58$ 股股票，亦即需要購買 $58$ 股股票即可達成 DAY0 $\Delta$-Hedging。

接著我們可以計算要花多少錢才可以建構此避險策略： ( 賣出選擇權與購入股票之後的花費)：
\[
58 \times 40 - 2.78 \times 100 = \$ 2042
\]故我們知道建構此避險策略需要花費 $\$ 2042$，故我們可借入此金額並考慮利率，亦即我們借入 $2042 \times e^{8\%/365} = 2042.45$，故利息為 $2042.45-2042=\$ 0.45$。現在總結 Day 0 如下：

購入 $58$ 股股票達成避險，然後我們需要借入 $2042$ 元並支付利息 $0.45$ 來達成此避險策略。

接著考慮 DAY 1
此時相關資訊(股價、選擇權價格、Delta)變動為 $S=40.5, c= \$ 3.06$, $\Delta=0.61$

我們可以先行計算 Overnight mark-market profits/loss :
\[
(40.5-40) \cdot (58) - (3.06-2.78) \cdot (100) - 0.45 = 0.55
\] 由於此時 $\Delta =0.61$ 已經改變，故我們需要重新調整股票數來消除風險。
首先考慮不進行避險情況，market-maker 本身為 $-\Delta \times 100 = -61$，故需要補足此 $61$ 股股票，但由於在 DAY0 已經購入 $58$ 股，故我們只需再購買 $61-58 = 3$ 股股票即可達成 DAY1 $\Delta$-Hedging。

現在我們來計算達成此避險策略所需的花費 (DAY1 total cost )：
\[
61 \times 40.5 - 3.06 \times 100 = 2164.5
\] 同樣地，我們可以得知需要借入 $2164.5$ 元且須支付利息為 $2164.5e^{8\%/365} - 2164.5=0.47$

考慮 DAY2 Mark-market Profits/loss：
此時相關資訊(股價、選擇權價格、Delta)變動為 $S=39.25, c= \$2.328$, $\Delta=0.53$
\[
(39.25-40.5) \cdot 61 - (2.328-3.06) \cdot 100 - 0.47 = -3.52 \ \ \ \ \square
\]

ref: John C. Hull, Options, Futures and Other Derivatives 7th.

延伸閱讀：[衍生商品] 希臘值與動態避險 (2) - Gamma and Gamma Neutrality

5/10/2011

[衍生商品] 淺談選擇權 (2) - Put-Call Parity

這次要介紹的是選擇權訂價一個重要的關係：買權賣權等價關係 (Put-Call Parity)：

想法：利用 Option 建構一個合成的 Forward contract ，再來比較其 payoff

現在考慮當前股價為 $S_0$ 的無配發股息的股票 (Non-dividend paying stock)，且 $C, P$ 為對應的 Call option 與 Put option 的價格；現在我們透過 Buying a call + Short a put 可以得到 Synthetic forward 如下圖 Payoff (點圖放大)

注意到上圖右方合成之後的 Payoff 圖等價 Long a forward ，故我們稱此利用 Option 所合成出來的 Forward 為 Synthetic forward。

另外，如果我們觀察對於 Synthetic Forward 而言，我們是透過 Buying a call + short a put 達成，故其當前的 Payoff (Payoff Today) 可寫為 $-C + P$ (買一份 call $ = -C$，賣出一份 put $=+p$)；且 Payoff at Expriation date 為 $S_T - K$

另外對於標準 Forward 而言，其 Payoff Today $=0$ (由於 Forward 並不需支付premium，故 Payoff today =0)；而 Pay off at Expriation date 為 $S_T -F_0$

因為我們的 Synthetic Forward 是用來 mimic 標準的 Forward ，故此兩者之 Payoff 必須等價，我們將所有的 payoff 都折現到 Today 來比較：

Payoff Today :
\[
-C + P + PV(S_T - K) = 0 + PV(S_T - F_0) \\
\Rightarrow C-P = PV( F_0 - K)
\] 又由於對 Forward 而言 $PV(F_0) := S_0$，故我們得到
\[
C-P = S_0 - PV( K)
\] 上式稱為 歐式選擇權無支付股息的 Put-Call Parity。

注意到如果上式出現
\[
C-P \neq S_0 - PV( K)
\] 則此時出現套利機會，因為 Put-Call parity 不再成立。亦即如果出現
$C > P + S_0 - PV( K) $ 則表示當前的 Call option 價格過高，可以 Short call + buy $(P+S_0 -PV(K))$ 達成套利。

或者 $C < P + S_0 - PV( K)$ 則表示當前的 call option 價格過低，可以 long call + sell $(P+S_0 -PV(K))$ 達成套利。

現在我們再問個問題，如果現在考慮 Divdend paying Stocks ，Put-Call Parity 該如何修正呢?
首先寫下一般 Put-Call Parity
\[
C-P = PV( F_0 - K)
\] 回憶對於有 Dividend paying 的 Forward ，我們有 $PV(F_0) := S_0 - PV(D)$，故我們將上式改寫
\[
C-P = S_0 - PV(D) -PV( K)
\] 上式即稱為歐式選擇權有支付股息的 Put-Call Parity

如果考慮股息為連續複利 $q$，則我們
\[
C-P = S_0 e^{-qT} -PV( K)
\]

現在我們看個例子：

Example: Put Call Parity
考慮一執行價格 $\$ 30$ 且六個月後到期的股票歐式 Call option 其價格為 $ \$ 2$，其標的股價為 $\$ 29$，且股息為 $\$ 0.5$ 預計於二個月與五個月的時候發放，無風險利率為 $10 \%$連續複利計，試求相同規格的 Put option 合理價格 (無套利機會價格) 應為多少?

Solution
改寫已知資訊如下：
\[
K=30, C=2, S_0=29, D=0.5, r=0.1, T=6/12
\]由 Put-Call parity 可知
\[\begin{array}{l}
C - P = {S_0} - PV\left( D \right) - K{e^{ - rT}}\\
\Rightarrow 2 - P = 29 - \left( {0.5{e^{ - 0.1 \times \frac{2}{{12}}}} + 0.5{e^{ - 0.1 \times \frac{5}{{12}}}}} \right) - 30{e^{ - 0.1 \times \frac{6}{{12}}}}\\
\Rightarrow P = 2.51
\end{array}\]

Example: No-Arbitrage Opportunity via Put-Call Parity
考慮一執行價格為 $50$ 且到期時間為 12個月的股票歐式 Call option ；且其價格為 $\$ 6$。同樣規格的的股票歐式 Put Option 價格為 $\$ 5$；另外市場當前股價為 $54$，配發股息預計於六個月後配發 $4$元，連續複利無風險年利率為 $5 \%$。

試問是否存在套利機會?

Solution
先求無套利機會價格，由 Put-Call parity
\[\begin{array}{l}
C - P = {S_0} - PV(D) - PV(K)\\
\Rightarrow C = P + {S_0} - PV(D) - PV(K)\\
\Rightarrow C = 5 + 54 - 4{e^{ - 0.05 \times \frac{6}{{12}}}} - 50{e^{ - 0.05 \times \frac{{12}}{{12}}}}\\
\Rightarrow C = 7.5373
\end{array}
\]注意到由 Put-call parity 得到的結果顯示 $C = 7.5373$ 但當前的 Call price 為 $6$ 故存在套利機會：由於當前 Call price 低於 7.5373，故我們可 Long Call option 接著賣出其餘組合如下表

\[\small{\begin{array}{l}
6 < C = P + {S_0} - PV(D) - PV(K)\\
\begin{array}{*{20}{c}}
{}&{Today}&{6\begin{array}{*{20}{c}}
{}
\end{array}month}&{At\begin{array}{*{20}{c}}
{}
\end{array}Exp.\left( {{S_T} \le K} \right)}&{At\begin{array}{*{20}{c}}
{}
\end{array}Exp.\left( {{S_T} > K} \right)}\\
\hline
{Long\begin{array}{*{20}{c}}
{}
\end{array}Call}&{ - C}&0&0&{{S_T} - K}\\
{Short\begin{array}{*{20}{c}}
{}
\end{array}Put}&{ + P}&0&{ - \left( {K - {S_T}} \right)}&0\\
{Short\begin{array}{*{20}{c}}
{}
\end{array}Stock}&{ + {S_0}}&{ - D}&{ - {S_T}}&{ - {S_T}}\\
{invest\begin{array}{*{20}{c}}
{}
\end{array}\$ D}&{ + PV\left( D \right)}&{ + D}&0&0\\
{invest\begin{array}{*{20}{c}}
{}
\end{array}\$ K}&{ - PV\left( K \right)}&0&K&K\\
{Total\begin{array}{*{20}{c}}
{}
\end{array}Gain}&{}&0&0&0
\end{array}\\
\\
\Rightarrow \begin{array}{*{20}{c}}
{}&{Today}&{6\begin{array}{*{20}{c}}
{}
\end{array}month}&{At\begin{array}{*{20}{c}}
{}
\end{array}Exp.\left( {{S_T} \le 50} \right)}&{At\begin{array}{*{20}{c}}
{}
\end{array}Exp.\left( {{S_T} > 50} \right)}\\
\hline
{Long\begin{array}{*{20}{c}}
{}
\end{array}Call}&{ - 6}&0&0&{{S_T} - 50}\\
{Short\begin{array}{*{20}{c}}
{}
\end{array}Put}&{ + 5}&0&{ - \left( {50 - {S_T}} \right)}&0\\
{Short\begin{array}{*{20}{c}}
{}
\end{array}Stock}&{ + {54}}&{ - 4}&{ - {S_T}}&{ - {S_T}}\\
{invest\begin{array}{*{20}{c}}
{}
\end{array}\$ D}&{ - 4{e^{ - 0.05 \times \frac{6}{{12}}}}}&{ + 4}&0&0\\
{invest\begin{array}{*{20}{c}}
{}
\end{array}\$ K}&{ - 50{e^{ - 0.05 \times \frac{{12}}{{12}}}}}&0&{50}&{50}\\
{Total\begin{array}{*{20}{c}}
{}
\end{array}Gain}&{1.5373}&0&0&0
\end{array}
\end{array}}\]

[衍生商品] 淺談選擇權 (1) - Some Properties of Option

延續上篇 [衍生商品] 淺談選擇權 (0) - Moneyness and profit/payoff of Option ，我們目標是要找出合理的定價。但目前對上述並無頭緒，只知道選擇權價值 = 內在價值與時間價值。
\[
\text{Option Value $=$ Intrinsic Value $+$ Time Value}
\] 然後由報價中，我們可以發現有一些參數似乎會影響我們對選擇權的定價。

現在我們總結需要的參數：

$K$: 執行價格 (Strike Price)

$S_0$: 當前標的資產價格 (這邊我們以當前股價表示) (Current Stock Price)
$\sigma$: 股價波動度 (Volatility)

$T$ : 到期時間 (Expiration time)
$r$ : 無風險利率 (risk-free interest rate)
$D$: 股息 (Dividend)
Style: 美式選擇權或者歐式選擇權。

接著我們討論當上述參數變動的時候，會對選擇權價格造成甚麼影響?

Varying Strike Price $K$：

現在考慮兩個不同的執行價格 $K_1, K_2$ 且 $K_1 < K_2$，則我們知道對於 Call option 而言，越低的執行價格代表越此 Call option 獲利機會相對較大，故Call option 售價在較低的執行價格應越高

\[ C(K_1) > C(K_2) \] 對 Put Option 而言，情況則相反

\[ P(K_1) < P(K_2) \] 那麼現在如果我們考慮兩選擇權除了 Strike price 以外其餘參數皆相同，則我們有如下重要結果：

\[\left\{ \begin{array}{l} {K_2} - {K_1} \ge C({K_1}) - C({K_2}) \ge 0\\ {K_2} - {K_1} \ge P({K_2}) - P({K_1}) \ge 0 \end{array} \right.\]

Varying Expiration Time $T$：

1. 對於美式選擇權而言，越長的 $T$ 表示有越多機會可以執行，故 $T$ 增大 $\Rightarrow$ 選擇權價格上升
2. 如果對歐式選擇權，到期時間的效果無法看出確切關係 (越長的 $T$ 並無法保證選擇權價格上升/下降)

選擇權價格的上/下界：
對於 Call Option 而言，其 Call option price 的上下界如下圖所示：，

對於 Put Option 而言，其 Put option price 的上下界如下圖所示：

現在我們看個例子：

Example: (Lower Bound of call option)
現在考慮一個 6個月到期且不支付股息的 Call option，當前股價為 $\$ 80$，執行價格為 $\$75$，且無風險年利率為 $10 \%$ 以連續複利計。試求其選擇權的下界應為何?

Solution
由於此為 Call option，我們知道其下界為
\[\begin{array}{l}
\max \{ {S_0} - PV(K),0\} \\
\Rightarrow \max \{ 80 - 75{e^{10\% \times \left( {6/12} \right)}},0\} = \max \{ 8.66,0\} = 8.66
\end{array}\]

延伸閱讀
[衍生商品] 淺談選擇權 (2) - Put-Call Parity

[衍生商品] 淺談選擇權 (0) - Moneyness and profit/payoff of Option

選擇權 (Option) 定義：為一個非綁定合約，給予持有者在合約上約定的 (未來)到期日期 (Expriation date)，依照合約上約定的 執行價格 (Strike price)，買入或者賣出標的資產 (EX: 股價、指數、外匯利率) 的權利。

Comment
1. 上述非綁定合約，意指持有者不一定要履行選擇權。亦可選擇放棄履行
2. 選擇權與期貨 (futures) 最大差別在於選擇權買方需先支付權利金 (premium) 給賣方。但期貨無須先支付權利金。

選擇權依照分類有兩種：

1. 買權 (Call option):
在指定到期日期，持有者有權利以 Strike price 購買標的資產

下圖為購買一組買權： Long (=Buy) a Call Option 在到期日的 Payoff 與 Profits (點圖放大)

上圖中 $C$ 表示 Call option 價格，而 $FV(C)$ 則為到期時刻 Call option 的 future value，$K$ 為執行價格， $S_T$ 為到期日時的股價。其 Payoff 與 Profit 用數學表示可寫為：
\[\left\{ \begin{array}{l}
{\rm{Payoff}}{{\rm{}}_{Call}}:\max \left\{ {{S_T} - K,0} \right\}\\
{\rm{Profit}}{{\rm{}}_{Call}}:\max \left\{ {{S_T} - K,0} \right\} - FV\left( C \right)
\end{array} \right.\]

2. 賣權 (Put option):
在指定到期日期，持有者有權利以 Strike price 賣出標的資產

下圖為購買一組賣權 Long (=Buy) a Put Option 在到期日的 Payoff 與 Profits (點圖放大)

上圖中 $P$ 表示 Put option 價格，而 $FV(P)$ 則為到期時刻 Put option 的 future value，$K$ 為執行價格， $S_T$ 為到期日時的股價。其 Payoff 與 Profit 用數學表示可寫為：
\[\left\{ \begin{array}{l}
{\rm{Payoff}}{{\rm{}}_{Put}}:\max \left\{ {K - {S_T},0} \right\}\\
{\rm{Profit}}{{\rm{}}_{Put}}:\max \left\{ {K - {S_T},0} \right\} - FV\left( P \right)
\end{array} \right.\]

另外亦可依照 何時可以執行 來分類

歐式選擇權 (European Option) : 只能在到期日才能執行買/賣權。
美式選擇權 (American Option) : 在到期日之前都能執行買/賣權。

Comment:
可以想見由於美式選擇權給予持有者更大的彈性決定甚麼時候要執行，故此選擇權價格必定會高於歐式選擇權。亦即如果我們稱 $C$ 為 Call option 價格， $P$ 為 Put Option 價格，則美式與歐式之間有如下關係：
\[
C_{American} \geq C_{European}\\
P_{American} \geq P_{European}
\]另外今日大多數選擇權交易都以美式選擇權為主。

有了上述觀念，我們可以在介紹新的專有名詞，稱作 Moneyness of Option：

術語：Moneyness of Option
一般而言，選擇權立刻執行的當下，我們可針對其 Payoff (立刻執行的當下，選擇權的價格) 進行討論，賺錢/賠錢/或者不賠不賺的情況有一些相對應的術語，我們把他寫在下面：

1. In the Money:
指如果立刻執行選擇權，則 payoff $>0$； (立刻執行會賺，稱 In the Money)
2. Out of the Money:
指如果立刻執行選擇權，則 payoff $<0$； (立刻執行會賠，稱 Out of the Money)

3. At the Money:
指如果立刻執行選擇權，則 Payoff $=0$； (立刻執行結果不賺不賠，稱 At the Money)

選擇權的價值 (Option Value)
選擇權價值 (Option Value) = 內在價值 (Intrinsic Value) + 時間價值 (Time Value)

亦即我們可說
\[
\text{Option Value $\geq$ Intrinsic Value }
\] 其中內在價格 = 如果現在立刻執行該選擇權所會獲得的 payoff；
時間價格 $>0$ always。

上述關係說明了時間價格的隱含意義，他指出時間價格用來表示儘管選擇權在一段時間內是 Out-of-money，但是隨著(未來)時間變動有可能會有上漲/下跌的可能，此可能性會導致儘管現在選擇權可能是處在 Out-of-money的狀態，其 Option Value 仍然是正值。因為人們可能預期未來選擇權的價值可能會上升

有了上述概念，我們可以開始先看一下一般而言，實際上選擇權是如何報價的：
下圖為美國芝加哥交易所(www.cboe.com) 對 S&P500 Index 的 American Option 報價 (Bid-Ask price)：

NOTE:
Ask price: 你要購買選擇權所需花費的價格，
Bid price 你要賣出選擇權所得的價格

上圖中，左方綠色部分為 Call option (買權) ，右方則為 Put Option (賣權)；且執行價格為 $K=500, 600, 700, ...,1,000$，到期日為 May 2014。

那麼現在問題是，這些Bid-Ask Price 究竟如何得到的呢? 怎麼知道這些價格是否合理??
這些問題將留待下一篇文章在做介紹。
[衍生商品] 淺談選擇權 (1) - Some Properties of Option
[衍生商品] 淺談選擇權 (2) - Put-Call Parity

5/06/2011

[最佳控制] 離散時間穩態 LQR 控制問題 (1)

延續前篇，這次要介紹的是 Discrete Time Linear Quadratic Regulator in Infinite Horizon 或稱 Steady State LQR。

================
LQR Problem (Infinite Horizon LQR)：
考慮離散狀態方程：
\[
x(k+1) = A x(k) + B u(k)
\]其中 $x(k) \in \mathbb{R}^n, A\in \mathbb{R}^{n \times n}, B \in \mathbb{R}^{n \times m}, u(k) \in \mathbb{R}^{m \times 1}$且 $(A,B)$ controllable。
定義 Performance index：
\[
J(u) = \displaystyle \sum_{k=0}^{\infty} x^T(k+1) Q x(k+1) + u^T(k) R u(k)
\] 其中 $Q, R$ 必須滿足 $Q^T = Q, Q \succ 0$， $R^T = R, R \succ 0$。 (亦即 $Q, R$ 必須為 對稱 + 正定 矩陣)

試求出一組最佳控制力序列 $u^*$ 使得成本函數 $J(u)$ 最小。
================

Comment:
讀者須注意到 Infinite Horizon 的 LQR問題要求計算 Performance index 為無窮級數和，此解必須保證收斂。以下定理告訴我們何時此 Performance index 收斂

Lemma
考慮離散系統 $x(k+1) = A x(k) + B u(k)$，若 $(A,B)$ 可控制，且選 $Q, R >0$ 為正定矩陣，則上述 infinite horizon LQR 問題保證閉迴路系統狀態收斂到 $0$ 且 cost 為有界。

Proof: omitted. (see J. B. Rawlings and D. Q. Mayne, "Model Predictive Control: Theory and Design, p. 24", 2009)

現在我們可以開始求解 Infinite Horizon LQR問題：
Solution
回憶 Steady State Bellman Equation，為了符號簡便起見，我們寫成 functional equation 形式，
\[
I(x) = \displaystyle \min_{u \in \Omega} \{J(x,u) + I(f(x,u)) \}
\] 上式中 $J(x,u)$ 為 Branch cost，亦即 $J(x,u) = x^T Q x + u^T R u$ (並非 $\sum_{k=0}^{\infty} (\cdot)...$)

首先我們猜一組解 $I(x) = x^T P x$ 且矩陣 $P$ 為對稱正定矩陣，亦即滿足 $P^T = P, P \succ 0$。我們之後會找到此 $P$ 應該長甚麼樣子。

將猜測的解代入上述的 Steady State Bellman Equation，故現在我們得到
\[
I(x) = \min_{u \in \Omega} \{J(x,u) + I(f(x,u)) \}
\]注意到 $I(f(x,u) = f(x,u)^T P f(x,u) = (Ax+Bu)^TP(Ax+Bu)$，故我們可得
\[
\begin{array}{l} I(x) = \mathop {\min }\limits_{u \in \Omega } \{ J(x,u) + I(f(x,u))\} \\ \Rightarrow {x^T}Px = \mathop {\min }\limits_u \left\{ {{x^T}Qx + {u^T}Ru + {{\left( {Ax + Bu} \right)}^T}P\left( {Ax + Bu} \right)} \right\}\\ \Rightarrow {x^T}Px = \mathop {\min }\limits_u \left\{ {{x^T}\left( {Q + {A^T}PA} \right)x + 2{x^T}{A^T}PBu + {u^T}Ru + {u^T}{B^T}PBu} \right\} \end{array}
\]透過一階必要條件 FONC: $ \frac{\partial }{{\partial u}} = 0$ 對上式右邊求解
\[\begin{array}{l} 2{\left( {{x^T}{A^T}PB} \right)^T} + 2Ru + 2{B^T}PBu = 0\\ \Rightarrow {u^*} = - {\left( {R + {B^T}PB} \right)^{ - 1}}{B^T}PAx \end{array}
\]現在將 $u^*$ 代回 $(*)$ 可得 \[\begin{array}{l} {x^T}Px = \mathop {\min }\limits_u \left\{ {{x^T}\left( {Q + {A^T}PA} \right)x + 2{x^T}{A^T}PBu + {u^T}Ru + {u^T}{B^T}PBu} \right\}\\ \Rightarrow {x^T}Px = \left\{ {{x^T}\left\{ {Q + {A^T}PA - {A^T}PB{{\left( {R + {B^T}PB} \right)}^{ - 1}}{B^T}PA} \right\}x} \right\} \end{array}
\]比較左右兩邊可得到 $P$ 必須滿足下式： \[P = Q + {A^T}PA - {A^T}PB{\left( {R + {B^T}PB} \right)^{ - 1}}{B^T}PA\] 此式稱為 Discrete Time Algebraic Ricatti Equation (ARE)，一般而言，可利用 MATLA 指令 dare(A,B,Q, R) 求解 P。

由於 $u^* = - {\left( {R + {B^T}PB} \right)^{ - 1}}{B^T}PAx$，其中除了 $P$ 未定之外，其餘所需要的參數都已知且皆與跌代時間無關，故此無窮時間LQR問題得到的最佳控制力為 Time invariant。

現在我們總結如下：求解無窮時間的LQR問題只要做兩個步驟即可

STEP 1: 求解一次 Algebraic Ricatti Equation 得到 $P$ (利用 MATLAB: dare.m 或者徒手計算)

\[
P = Q + {A^T}PA - {A^T}PB{\left( {R + {B^T}PB} \right)^{ - 1}}{B^T}PA
\]STEP2 : 將 $P$ 代入 ${u^*} = - {\left( {R + {B^T}PB} \right)^{ - 1}}{B^T}PAx$

下面我們看個例子：

Example:
考慮一個離散時間線性系統狀態方程：
\[
x_1(k+1) = x_2(k) \\
x_2(k+1) = x_1(k) + u(k)
\]且考慮 Cost function：
\[
J = \sum_{k=0}^{\infty}2x_1^2(k) + 2x_1(k)x_2(k) + x_2^2(k) + 3u^2(k)
\] 且控制力具有如下形式：
\[
u(k) = K_1 x_1(k) + K_2 x_2(k)

\] 試求 $K_1, K_2$ 使上述 Cost function 最小：

Solution
首先定義 $x(k) := [x_1(k), x_2(k)]^T$ ，則我們有
\[x\left( {k + 1} \right) = \underbrace {\left[ {\begin{array}{*{20}{c}}
0&1\\
1&0
\end{array}} \right]}_A\left[ {\begin{array}{*{20}{c}}
{{x_1}(k)}\\
{{x_2}(k)}
\end{array}} \right] + \underbrace {\left[ {\begin{array}{*{20}{c}}
0\\
1
\end{array}} \right]}_Bu(k)
\] 與 Cost function
\[\begin{array}{l}
J = \sum\limits_{k = 0}^\infty {(2x_1^2(} k) + 2{x_1}(k){x_2}(k) + x_2^2(k) + 3{u^2}(k))\\
\begin{array}{*{20}{c}}
{}
\end{array} = x{\left( k \right)^T}\underbrace {\left[ {\begin{array}{*{20}{c}}
2&1\\
1&1
\end{array}} \right]}_Qx\left( k \right) + \underbrace 3_R{u^2}(k)
\end{array}
\] 那麼現在此問題變成 Steady-state LQR problem，故由前述討論可知我們有 Optimal feedback control 為
\[
u^*(k) = -(R+B^T P B)^{-1} B^T PA \cdot x(k)

\] 其中 $P$ 滿足 $P=P^T, P \succ 0$ 可由 ARE
\[
P= A^TPA - A^T PB (R+ B^TPB)^{-1}B^TPA+Q

\]利用 MATLAB 指令 dare(A,B,Q,R) 解得 $P = \left[ {\begin{array}{*{20}{c}}
{3.7841}&{1.6815}\\
{1.6815}&{4.4022}
\end{array}} \right]$ 現在將 $P$ 帶回 $u^*$中
\[u\left( k \right) = - \left[ {\begin{array}{*{20}{c}}
{0.5947}&{0.2272}
\end{array}} \right]x\left( k \right)

\]i.e., $K_1 = -05947, K_2 =-0.2272$. $\square$

5/05/2011

[最佳控制] 離散時間 LQR- Finite Time Horizon

這次要介紹控制理論中一個重要的結果：
Discrete Time Linear Quadratic Regulator (LQR) in Finite Time Horizon，
中文翻譯為離散時間線性二次調節器，我們這邊會針對此問題利用 Dynamic Programming 的方法來逐步求解

================
LQR Problem (Finite Horizon)：
考慮狀態方程：
\[
x(k+1) = A x(k) + B u(k)
\]其中 $x(k) \in \mathbb{R}^n, A\in \mathbb{R}^{n \times n}, B \in \mathbb{R}^{n \times m}, u(k) \in \mathbb{R}^{m \times 1}$
且考慮 Performance index：
\[
J(u) = \displaystyle \sum_{k=0}^{N-1} x^T(k+1) Q x(k+1) + u^T(k) R u(k)
\] 其中 $Q, R$ 必須滿足 $Q^T = Q, Q \succ 0$， $R^T = R, R \succ 0$。 (亦即 $Q, R$ 必須為 對稱 + 正定 矩陣)

試求出一組最佳控制力序列 $u(N-1), u(N-2),... u(0)$ 使得成本函數 $J(u)$ 最小。
================

Comment:
1. LQR 顧名思義是其具有系統狀態方程為線性 $x(k+1) = Ax(k)+Bu(k)$ 與 Performance Index 中的項都為二次式。
\[
J(u) = \displaystyle \sum_{k=0}^{N-1} x^T(k+1) Q x(k+1) + u^T(k) R u(k)
\]
2. 上述對於矩陣 $Q, R$ 的對稱與正定假設是必須的 (之後需求在求解最佳控制力序列的時候需要求解反矩陣，故需要這些性質。)

3. 上述 LQR in Finite Horizon的問題所求得的最佳控制力序列為 Time Varying 。(此性質會在下面求解的時候再度強調。)

4. 若 Performance index 考慮 $N \rightarrow \infty$，亦即
\[
J(u) = \displaystyle \sum_{k=0}^{\infty} x^T(k+1) Q x(k+1) + u^T(k) R u(k)
\]則我們說此問題為 LQR in Infinite Horizon 或稱 Steady State LQR。這類問題會在之後再做介紹。(此類問題所得到的最佳控制序列將不再是 Time Varying，且只需求解一次 Algebraic Ricatti Equation 即可獲得最佳控制力序列)

Solution of Discrete Time LQR problem in Finite Horizon
現在我們開始進行求解。

這邊我們使用 Dynamic Programming 方法來求解上述 LQR問題。回憶 Dynamic Programming Equation 的定義：
\[I\left( {x\left( l \right),N - l} \right) = \mathop {\min }\limits_{u\left( l \right) \in {\Omega _l}} \left\{ {J\left( {x\left( l \right),u\left( l \right)} \right) + I\left( {x\left( {l + 1} \right),N - \left( {l + 1} \right)} \right)} \right\}
\] 考慮 Optimal Cost of one-step-to-go ($l=N-1$):
\[\begin{array}{l}
\Rightarrow I\left( {x\left( {N - 1} \right),1} \right) = \min \left\{ {J\left( {x\left( {N - 1} \right),u\left( {N - 1} \right)} \right) + I\left( {x\left( N \right),0} \right)} \right\}\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}
\end{array} = \min \left\{ {{x^T}(N)Qx(N) + {u^T}(N - 1)Ru(N - 1)} \right\}
\end{array}
\]將系統狀態方程 $x(k+1) = A x(k) + B u(k) $ 代入：
\[\begin{array}{l}
\Rightarrow I\left( {x\left( {N - 1} \right),1} \right) = \\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array}\min \left\{ \begin{array}{l}
{\left[ {Ax\left( {N - 1} \right) + Bu\left( {N - 1} \right)} \right]^T}Q\left[ {Ax\left( {N - 1} \right) + Bu\left( {N - 1} \right)} \right]\\
+ {u^T}(N - 1)Ru(N - 1)
\end{array} \right\}\\
\Rightarrow I\left( {x\left( {N - 1} \right),1} \right) = \min \left\{ \begin{array}{l}
{x^T}\left( {N - 1} \right){A^T}QAx\left( {N - 1} \right)\\
\begin{array}{*{20}{c}}
{}
\end{array} + 2{x^T}\left( {N - 1} \right){A^T}QBu\left( {N - 1} \right)\\
\begin{array}{*{20}{c}}
{}
\end{array} + {u^T}\left( {N - 1} \right){B^T}QBu\left( {N - 1} \right)\\
\begin{array}{*{20}{c}}
{}
\end{array} + {u^T}(N - 1)Ru(N - 1)
\end{array} \right\}
\end{array}
\] 由一階必要條件 FONC： ${\nabla _{u\left( {N - 1} \right)}}I\left( {x\left( {N - 1} \right),1} \right) = 0$ 可知
\[\begin{array}{l}
2{B^T}{Q^T}Ax\left( {N - 1} \right) + 2{B^T}QBu\left( {N - 1} \right) + 2Ru(N - 1) = 0\\
\Rightarrow \left[ {R + {B^T}QB} \right]u(N - 1) = - {B^T}{Q^T}Ax\left( {N - 1} \right)\\
\Rightarrow u^*(N - 1) = - \underbrace {{{\left[ {R + {B^T}QB} \right]}^{ - 1}}{B^T}QA}_{K\left( {N - 1} \right)}x\left( {N - 1} \right)
\end{array}
\]接著我們把上述求得的 1-step-to-go 的最佳控制力 $u^*(k)$ 代回 Optimal cost of 1-step-to-go，我們得到 (透過一些代數運算)
\[I\left( {x\left( {N - 1} \right),1} \right) = {x^T}\left( {N - 1} \right)\underbrace {{A^T}\left\{ {Q - QB{{\left[ {R + {B^T}QB} \right]}^{ - 1}}^T{B^T}Q} \right\}A}_{: = M\left( {N - 1} \right)}x\left( {N - 1} \right)
\]在做下一步跌代之前我們先給個 comments

Comments :
1.注意到上式中我們求 ${u^*}(N - 1) = - {\left[ {R + {B^T}QB} \right]^{ - 1}}{B^T}QAx\left( {N - 1} \right)$ 需要計算反矩陣 ${\left[ {R + {B^T}QB} \right]^{ - 1}}$ ，故需檢驗反矩陣是否存在：不過這個問題可以被證明反矩陣確實存在： (因為 $R$ 為對稱正定矩陣，$B^TQB$ 為對稱半正定矩陣，由FACT: 正定矩陣+ 半正定矩陣 = 正定矩陣，且正定矩陣具有 eigenvalue 全為正，故可推知反矩陣存在。)

2. 上式所求得的最佳控制力 ${u^*}(N - 1) = - {\left[ {R + {B^T}QB} \right]^{ - 1}}{B^T}QAx\left( {N - 1} \right) = - K\left( {N - 1} \right)x\left( {N - 1} \right)$ 其中的 $K_{N-1}$ 稱作 Optimal Gain Matrix。此控制力具有回授控制形式 Feedback form。 (類似 $u=-Kx$ 的形式)

3. 最佳控制力儘管具有回授控制 (Feedback form)的形式，但在此問題中為時變得 Gain。此性質在下一步跌代會顯現出來。

4. 當我們有了上述第一步跌代的結果，整個 LQR問題就簡單許多，因為之後的跌代只有 $Q$ 矩陣會改變其餘結果均不變。我們直接看下一步跌代便會發現此性質：

Back to computation :
考慮 Optimal Cost of 2-steps-to-go： ($l=N-2$):
\[\begin{array}{l}
I\left( {x\left( {N - 2} \right),2} \right) = \min \left\{ {J\left( {x\left( {N - 2} \right),u\left( {N - 2} \right)} \right) + I\left( {x\left( {N - 1} \right),1} \right)} \right\}\\
\Rightarrow I\left( {x\left( {N - 2} \right),2} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = \min \left\{ \begin{array}{l}
{x^T}(N - 1)Qx(N - 1) + {u^T}(N - 2)Ru(N - 2)\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} + {x^T}\left( {N - 1} \right)M\left( {N - 1} \right)x\left( {N - 1} \right)
\end{array} \right\}\\
\Rightarrow I\left( {x\left( {N - 2} \right),2} \right)\\
\begin{array}{*{20}{c}}
{}&{}
\end{array} = \min \left\{ {{x^T}(N - 1)\underbrace {\left[ {Q + M\left( {N - 1} \right)} \right]}_{: = \tilde Q}x\left( {N - 1} \right) + {u^T}(N - 2)Ru(N - 2)} \right\}
\end{array}
\]可以發現上式中只有 $Q$ 變成了 $\tilde{Q}$ 其餘參數均固定。故我們可以馬上寫下對應的最佳控制力 $u^*(N-2)$:
\[{u^*}(N - 2) = - {\left[ {R + {B^T}\tilde QB} \right]^{ - 1}}{B^T}\tilde QAx\left( {N - 2} \right) = K (N-2) x(N-2)
\]其對應的 Optimal cost of 2 steps to go：
\[I\left( {x\left( {N - 2} \right),2} \right) = {x^T}\left( {N - 2} \right)\underbrace {{A^T}\left\{ {\tilde Q - \tilde QB{{\left[ {R + {B^T}\tilde QB} \right]}^{ - 1}}^T{B^T}\tilde Q} \right\}A}_{: = M\left( {N - 2} \right)}x\left( {N - 2} \right)
\]故我們只需要持續重複上述步驟，即可依序解得 $K(N-3), K(N-4),..., K(0)$ 與 $M(N-3), M(N-4),...,M(0)$ 與 $J^*$

Comment:
注意到 $u^*(N-2)$ 的 Gain $K(N-2)$ 與 $u^*(N-1)$ 的 Gain $K(N-1)$ 並不相同，此說明了之前所敘的時變特性(Time Varying Property)

4/28/2011

[衍生商品] 希臘值與動態避險 (0) - Delta and Delta Neutral

這次要介紹的是財務中的希臘值 Greek Letters:
\[ \Delta, \Gamma, \Theta, \rho, \nu
\]，上述的這些希臘字母被用作財務中衍生商品的 避險 (Hedging) 的指標。

那麼問題是這些希臘字母到底如何跟避險扯上關係呢? 這必須要回歸 Black-Scholes Formula：
\[\left\{ \begin{array}{l}
C = S{e^{ - qT}}N \left( {{d_1}} \right) - K{e^{ - rT}}N \left( {{d_2}} \right)\\
P = K{e^{ - r(T)}}N \left( { - {d_2}} \right) - S{e^{ - qT}}N \left( { - {d_1}} \right)
\end{array} \right.\]
其中 $C$ 為 Call option 價格，$P$ 為 Put Option 價格， $N(\cdot)$ 為 Standard Normal Cumulative distribution function (CDF)，且\[\left\{ \begin{array}{l}
{d_1} = \frac{{\ln (S/K) + (r - q + \frac{1}{2}{\sigma ^2})(T)}}{{\sigma \sqrt T }}\\
{d_2} = {d_1} - \sigma \sqrt T
\end{array} \right.\]

觀察上述 Black-Scholes Formula，我們知道選擇權價格 $C, P$ 可表為一個多變數的函數
\[
f(S,K,T,r,q,\sigma)
\]其中 $S$ 為現時股價，$K$ 為執行價格， $T$ 為到期時間， $r$ 為連續複利的無風險年利率， $q$ 為連續複利的年股息，$\sigma$ 為波動度。

想法：對於 B-S formula 所求得的 $f(S,K,T,r,q,\sigma)$ 對特定參數的變動，我們用一個特定希臘字母來表示他，這些變動用來測量不同的風險：

這邊先介紹 $\Delta$
\[
\Delta := \frac{\partial f}{ \partial S}
\]亦即表示為選擇權價格對股價的變化率。(由於其為一階導數，故為斜率)

回憶先前介紹過，
對於 Long Call Position： $0 \leq \Delta \leq 1$ (Short call 則對左式同取負號)
對於 Long Put Position ： $-1 \leq \Delta \leq 0$ (Short put 則對左式同取負號)

上述結果可繪製如下圖：

Comment:
1. 如果 $\Delta =0$，則表示股票些微變化不影響選擇權價格。且此狀態稱為 Delta Neutral
2. $\Delta$ 在 Black-Scholes Call opton formula 中等價為 $e^{-qT}N(d_1)$；亦即
\[
\Delta := \frac{{\partial f}}{{\partial S}} = e^{-qT}N\left( {{d_1}} \right)
\] 其中 $N(\cdot)$ 為 Cumulative normal distribution。
3. 關於 Put Option 與 Call Option 的 $\Delta$ 值之間存在一固定關係，我們將此關係寫成下面的 Claim :

Claim:
對於 Call option 與 Put Option 的 $\Delta$ 有如下關係：
\[
\Delta_c - \Delta_p = e^{-qT}
\]Proof
上述關係可以很簡潔的利用 Put-Call Parity 來證明，現在回憶 Put-Call Parity 如下：
\[
C-P = Se^{-qT} - Ke^{-rT}
\]對上式兩邊取對 $S$ 偏導數 $\frac{{\partial }}{{\partial {\rm{S}}}}$：
\[\begin{array}{l}
C - P = S{e^{ - qT}} - K{e^{ - rT}}\\
\Rightarrow \underbrace {\frac{{\partial C}}{{\partial S}}}_{{\Delta _c}} - \underbrace {\frac{{\partial P}}{{\partial S}}}_{{\Delta _p}} = {e^{ - qT}}\\
\Rightarrow {\Delta _c} - {\Delta _p} = {e^{ - qT}}
\end{array}\] $\square$

投資組合的 Delta 與 Superposition (Delta of Portfolio)
現在考慮 $\Pi $ 為投資組合的價值，則對單一資產 (價格為 $S$) 的選擇權或其他衍生商品所組成的投資組合之 $\Delta$ 定義為
\[
\frac{\partial \Pi}{\partial S}
\] 投資組合的 $\Delta$ 值可由投資組合中，可先分別計算各自單一的 Options 的 $\Delta$ 值在做線性組合：亦即若考慮投資組合由數量為 $w_i$ 的選擇權所組合而成 $(1 \leq i \leq n)$ 且對應地 $i$ 個 Option 的 $\Delta$ 值為 $\Delta_i$，則此投資組合的總 $\Delta$ 值為
\[
\Delta = \displaystyle \sum_{i=1}^{n} w_i \Delta_i \ \ \ \ (*)
\]

現在我們看個例子：

Example
考慮某金融機構持有下列三種某標的資產股票：

Long 100,000 call options ，執行價格為 $K=55$，到期時間 $T=3$ 個月，$\Delta=0.533$
Short 200,000 Call options﹑，執行價格為 $K=56$，到期時間 $T=5$ 個月，$\Delta=0.468$
Short 50,000 Call options﹑，執行價格為 $K=56$，到期時間 $T=2$ 個月，$\Delta=-0.508$

則此金融機構的總 $\Delta$ 可由 $(*)$ 計算而得
\[
\Delta = 100,000 \times 0.533 - 200,000 \times 0.468 - 50,000 \times (-0.508) = -14,900
\]亦即，如果要達到使此投資組合為 Delta Neutral，則必須購入 $14,900$ 股股票。

ref: John C. Hull, Options, Futures and Other Derivatives 7th.

延伸閱讀：
[衍生商品] 希臘值與動態避險 (1)-Delta Hedging Example

訂閱：文章 (Atom)