跳到主要內容

[數學分析] 多變數函數的偏導數

令 $E\subset \mathbb{R}^n$ 為 open set。
考慮函數 ${\bf f}: E \subset \mathbb{R}^n \to \mathbb{R}^m$ 。令 $\{{\bf e}_1,...,{\bf e}_n\}$ 與 $\{{\bf u}_1,...,{\bf u}_m\}$ 各為 $\mathbb{R}^n$ 與 $\mathbb{R}^m$ 的 standard bases。則我們可以將 $\bf f$ 以分量(components)形式 $f_i$ 表示:對任意 ${\bf x} \in E$,
\[
{\bf f}({\bf x}) := \sum_{i=1}^m f_i ({\bf x}){\bf u}_i =f_1 {\bf u}_1 + ... + f_m {\bf u}_m
\]或者${f_i}\left( {\bf{x}} \right) = {\bf{f}}\left( {\bf{x}} \right) \cdot {{\bf{u}}_i},i = 1,...,m$

對任意 ${\bf x} \in E $,$1 \le i \le m$ 且 $1 \le j \le n$ 我們可以定義 偏導數 (Partial Derivative)
\[\left( {{D_j}{f_i}} \right)\left( {\bf{x}} \right): = \mathop {\lim }\limits_{t \to 0} \frac{{{f_i}\left( {{\bf{x}} + t{{\bf{e}}_j}} \right) - {f_i}\left( {\bf{x}} \right)}}{t}\]若上述極限存在。

Comments:
1. 注意到 $f_i({\bf x}) = f_i(x_1,...,x_n)$ 故 $D_j f_i$ 表示了固定其餘變數,僅對 $f_i$ 中的 $x_j$ 求導:故我們記做
\[
D_jf_i ({\bf x}) := \frac{\partial f_i}{\partial x_j}
\]並且稱 $D_jf_i$ 為偏導數 (Partial Derivative)

2. 對任意多變數連續函數而言,儘管偏導數存在並不保證全導數存在:但反之則成立:亦即若 $\bf f$ 在點 $\bf x$ 上可微,則其在 $\bf x$處的偏導數存在:且偏導數完全決定了 linear transformation ${\bf f}'({\bf x})$

3. 同 2 偏導數存在不保證 連續。以下我們看個例子:

Example
若 $f(0,0)=(0,0)$ 且 若 $(x,y) \neq (0,0)$
\[
f(x,y) := \frac{xy}{x^2 + y^2}
\](a) 試證 $(D_1 f)(x,y)$ 與 $D_2 f (x,y) $ 在 $\mathbb{R}^2$ 中每一點皆存在。
(b) 試證 $f$ 在 $(0,0)$ 處並不連續。

Proof:
注意到 $f: \mathbb{R}^2 \to \mathbb{R}^1$ ;故我們可利用偏導數定義計算 $(D_1 f)(x,y)$ 與 $D_2 f (x,y) $:首先令 $(x,y) \neq (0,0)$可知
\[\begin{array}{l}
{D_1}f\left( {x,y} \right) = \mathop {\lim }\limits_{h \to 0} \frac{{f\left( {x + h,y} \right) - f\left( {x,y} \right)}}{h}\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = \mathop {\lim }\limits_{h \to 0} \frac{{\frac{{\left( {x + h} \right)y}}{{{{\left( {x + h} \right)}^2} + {y^2}}} - \frac{{xy}}{{{x^2} + {y^2}}}}}{h}\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}
\end{array} = \mathop {\lim }\limits_{h \to 0} \frac{{y\left[ {{y^2} - x\left( {x + h} \right)} \right]}}{{\left( {{{\left( {x + h} \right)}^2} + {y^2}} \right)\left( {{x^2} + {y^2}} \right)}} = \frac{{y\left( {{y^2} - {x^2}} \right)}}{{{{\left( {{x^2} + {y^2}} \right)}^2}}}
\end{array}\]同理,
\[{D_2}f\left( {x,y} \right) = \mathop {\lim }\limits_{h \to 0} \frac{{f\left( {x,y + h} \right) - f\left( {x,y} \right)}}{h}{\rm{ = }}\frac{{x\left( {{y^2} - {x^2}} \right)}}{{{{\left( {{x^2} + {y^2}} \right)}^2}}}\]上述兩 偏導數 在 $\mathbb{R}^2 \setminus (0,0)$ 處皆存在。接著我們計算 $(x,y)=(0,0)$ 處的偏導數。
\[\left\{ \begin{array}{l}
{D_1}f\left( {0,0} \right) = \mathop {\lim }\limits_{h \to 0} \frac{{f\left( {0 + h,0} \right) - f\left( {0,0} \right)}}{h} = \mathop {\lim }\limits_{h \to 0} \frac{{0 - 0}}{h} = 0\\
{D_2}f\left( {0,0} \right) = \mathop {\lim }\limits_{h \to 0} \frac{{f\left( {0,0 + h} \right) - f\left( {0,0} \right)}}{h} = \mathop {\lim }\limits_{h \to 0} \frac{{0 - 0}}{h} = 0
\end{array} \right.\]

(b) 我們要證 $f$ 在 ${\bf 0} := (0,0)$ 處並不連續。亦即 對 ${\bf 0}$ 而言, 要證明 存在 $\varepsilon >0$ 使得對任意 $\delta >0 $ 存在 ${\bf x}:= (x,y) \neq 0$ 使得
\[
||{\bf x} - {\bf 0}|| < \delta \text{ but }\; |f({\bf x}) - f({\bf 0})| \ge \varepsilon
\] 取 $\varepsilon :=1$ 且 $\delta>0$ 與 ${\bf x}:= (x,y) = (\delta/2,\delta/2) \neq 0$ 則可知
\[{\rm{but |}}f({\bf{x}}) - f({\bf{0}})| = \left| {\frac{{\frac{\delta }{2}\frac{\delta }{2}}}{{{{\frac{\delta }{2}}^2} + {{\frac{\delta }{2}}^2}}} - 0} \right| = \left| {\frac{1}{2} - 0} \right| = \frac{1}{2} > \frac{1}{4} = \varepsilon \]


=============
Theorem 1:
考慮 ${\bf f}: E \subset \mathbb{R}^n \to \mathbb{R}^m$ 且 $\bf f$ 在點 ${\bf x} \in E$處可導,則偏導數 $(D_jf_i)({\bf x})$ 存在且 偏導數完全決定了 ${\bf f}'({\bf x})$:亦即
\[{\bf{f}}'\left( {\bf{x}} \right){{\bf{e}}_j} = \sum\limits_{i = 1}^m {\left( {{D_j}{f_i}} \right)\left( {\bf{x}} \right){{\bf{u}}_i}} ,\begin{array}{*{20}{c}}
{}
\end{array}\left( {1 \le j \le n} \right)\]=============

Proof: omitted.

上述定理可以讓我們將 Linear operator ${\bf f}'({\bf x})$ 表達成矩陣的形式:
\[{\bf{f}}'\left( {\bf{x}} \right) = {\left[ {\begin{array}{*{20}{c}}
{{D_1}{f_1}}&{{D_2}{f_1}}& \cdots &{{D_n}{f_1}}\\
{{D_1}{f_2}}&{{D_2}{f_2}}& \cdots &{{D_n}{f_2}}\\
 \vdots &{}& \ddots & \vdots \\
{{D_1}{f_m}}&{}& \cdots &{{D_n}{f_m}}
\end{array}} \right]_{n \times m}}\]

現在我們看個重要的結果:
=============
Theorem 2: 假設 $\bf f$ 為 map 由 convex open set $E \subset \mathbb{R}^n \to \mathbb{R}^m$,且 $\bf f$ 在 $E$ 上可導,且存在 $M \in \mathbb{R}$ 使得 對任意 $\bf x$ $\in E$, 其 operator norm $||{\bf f}'({\bf x})|| \le M$ 則 對任意 $\bf a,b$ $\in E$,
\[||{\bf{f}}({\bf{b}}) - {\bf{f}}\left( {\bf{a}} \right)|| \le M||{\bf{b}} - {\bf{a}}||
\]=============

Proof:
我們要證明 $||{\bf{f}}({\bf{b}}) - {\bf{f}}\left( {\bf{a}} \right)|| \le M||{\bf{b}} - {\bf{a}}||$

注意到 $E$ 為 convex open set,故我們可利用 convexity 定義,現在對 任意點  $\bf x:=\gamma(t)$ $\in E$,與任意 $t \in [0,1]$ 可取
\[{\bf{x}}: =\gamma(t)= \left( {1 - t} \right){\bf{a}} + t{\bf{b}}\]現在若我們定義 ${\bf{g}}\left( t \right): = {\bf{f}}\left( {\gamma \left( t \right)} \right)$ 則由於 $\gamma$ 在 $(a,b)$ 可導(因為 $\gamma$ 為線性方程 ) 且 $\bf f$ 亦在  $(a,b)$ 可導(由假設可知) ;故可利用 Chain Rule \[\begin{array}{l}
{\bf{g}}'\left( t \right): = {\bf{f}}'\left( {\gamma \left( t \right)} \right)\gamma '\left( t \right) = {\bf{f}}'\left( {\gamma \left( t \right)} \right)\left( {{\bf{b}} - {\bf{a}}} \right)\\
 \Rightarrow \left\| {{\bf{g}}'\left( t \right)} \right\| \le \left\| {{\bf{f}}'\left( {\gamma \left( t \right)} \right)} \right\|\left\| {\left( {{\bf{b}} - {\bf{a}}} \right)} \right\| \le M\left\| {\left( {{\bf{b}} - {\bf{a}}} \right)} \right\|
\end{array}\]上式對 $t \in [0,1]$ 成立,故由 Mean Value Theorem 可知
\[\left\| {{\bf{g}}\left( 1 \right) - {\bf{g}}\left( 0 \right)} \right\| \le M\left\| {\left( {{\bf{b}} - {\bf{a}}} \right)} \right\| \ \ \ \  (\star)
\]但注意到
\[{\bf{g}}\left( t \right): = {\bf{f}}\left( {\gamma \left( t \right)} \right) \Rightarrow \left\{ \begin{array}{l}
{\bf{g}}\left( 1 \right): = {\bf{f}}\left( {\gamma \left( 1 \right)} \right) = {\bf{f}}\left( {\bf{b}} \right)\\
{\bf{g}}\left( 0 \right): = {\bf{f}}\left( {\gamma \left( 0 \right)} \right) = {\bf{f}}\left( {\bf{a}} \right)
\end{array} \right.\]故 $(\star)$ 可改寫為 $\left\| {{\bf{f}}\left( {\bf{b}} \right) - {\bf{f}}\left( {\bf{a}} \right)} \right\| \le M\left\| {\left( {{\bf{b}} - {\bf{a}}} \right)} \right\|$ $\ \ \ \ \ \square$

Corollary:
若 $\bf f'$ $({\bf x}) = \bf 0$ 對任意 $\bf x $ $\in E$,則 $\bf f$ 為常數。

Proof:
要證明 $M=0$ 即可。但注意到前述 Theorem 中對於 $M$ 假設亦包含 $0$ 故證畢。 


現在我們可以開始將導數 與 偏導數 之間性質做連結,注意到 如果一個 函數的 導數 存在且該導數連續,我們是否可以說其 偏導數存在 且 連續呢? 同樣的如果 偏導數存在 且 連續,可否說函數的導數存在且連續? 此答案記做下面的定理 Theorem 4

不過在給出 Theorem 4 之前,我們需要一些定義 何謂導數存在且導數連續:

===========
Definition: f is $C^1$ function
考慮函數 $\bf f$ $E \to \mathbb{R}^m$ 在 $E$ 上可導 且 $\bf f'$ $: E \to L(\mathbb{R^n},\mathbb{R}^m)$ 為連續函數,則我們說此函數 $\bf f$ $ \in C^1(E)$。

Definition: f' is continuous
我們稱 函數 $\bf  f'$ $: E \to L(\mathbb{R^n},\mathbb{R}^m)$  為連續函數 若下列條件成立:
對任意 $\bf x$ $\in E$,且任意 $\varepsilon >0$, 存在 $\delta >0$ 使得 對 $\bf y$ $\in E$,我們有
\[||{\bf{x}} - {\bf{y}}|| < \delta  \Rightarrow ||{\bf{f}'}\left( {\bf{x}} \right) - {\bf{f}'}\left( {\bf{y}} \right)|| < \varepsilon \]===========

Comments:
注意到 上述定義中 由於 $\bf x,y$ $\in E$,故其 norm 為定義在 $E$上的 norm ;但是 $\bf f'$ 為 linear operator 故其 norm $||{\bf{f}}\left( {\bf{x}} \right) - {\bf{f}}\left( {\bf{y}} \right)|{|_L} < $ 為 operator norm。亦即 \[||{\bf{f}'}\left( {\bf{x}} \right) - {\bf{f}'}\left( {\bf{y}} \right)|{|_L}: = \mathop {\sup }\limits_{{\bf{h}} = 1} ||{\bf{f}'}\left( {\bf{x}} \right){\bf{h}} - {\bf{f}'}\left( {\bf{y}} \right){\bf{h}}||\]


現在我們可以給出 Theorem 4:偏導數存在 且 連續,若且唯若 函數的導數存在且連續

Theorem 4:
若 $\bf f$ $:E \subset{\mathbb{R}^n} \to \mathbb{R}^m$,則 $\bf f$ $\in C^1(E)$ 若且唯若 其偏導數 $D_j f_i({\bf x})$ 存在 且連續。

Proof: omitted

留言

這個網誌中的熱門文章

[數學分析] 什麼是若且唯若 "if and only if"

數學上的 if and only if  ( 此文不討論邏輯學中的 if and only if,只討論數學上的 if and only if。) 中文翻譯叫做  若且唯若 (or 當且僅當) , 記得當初剛接觸這個詞彙的時候,我是完全不明白到底是甚麼意思,查了翻譯也是愛莫能助,畢竟有翻跟沒翻一樣,都是有看沒有懂。 在數學上如果看到 if and only if  這類的句子,其實是表示一種 雙條件句 ,通常可以直接將其視為" 定義(Definition)" 待之,今天要分享的是這樣的一個句子如何用比較直觀的方法去看他 假設我們現在有 兩個邏輯陳述句 A 與  B. 注意到,在此我們不必考慮這兩個陳述句到底是什麼,想表達什麼,或者到底是否為真(true),這些都不重要。只要知道是兩個陳述即可。 現在,考慮新的陳述:  "A if and only if B" 好了,現在主角登場,我們可以怎麼看待這個句子呢? 事實上我們可以很直覺的把這句子拆成兩部分看待,也就是 "( A if B ) and ( A only if B )" 那麼先針對第一個部分  A if B  來看, 其實這句就是說  if B then A, 更直白一點就是 "if B is true, then A is also true".  在數學上等價可以寫為 "B implies A" .  或者更常用一個箭頭符號來表示 "B $\Rightarrow$  A"  現在針對第二個部分  A only if B 此句意指  "If B is not true, then A is also not true". 所以如果已知 A is true,  那麼按照上句不難推得 B is also true 也就是說  A only if B  等價為 "If A is true then B is also true". 同樣,也可以寫作   "A implies B"   或者用箭頭表示  "A   $\Rightarrow$     B".

[數學分析] 淺談各種基本範數 (Norm)

這次要介紹的是數學上一個重要的概念: Norm: 一般翻譯成 範數 (在英語中 norm 有規範的意思,比如我們說normalization就是把某種東西/物品/事件 做 正規化,也就是加上規範使其正常化),不過個人認為其實翻譯成 範數 也是看不懂的...這邊建議把 Norm 想成長度就好 (事實上norm是長度的抽象推廣), 也許讀者會認為好端端的長度不用,為何又要發明一個 norm 來自討苦吃?? 既抽象又艱澀。 事實上想法是這樣的: 比如說現在想要比較兩個數字 $3$ , $5$ 之間的大小,則我們可以馬上知道 $ 3 < 5 $;同樣的,如果再考慮小數與無理數如 $1.8753$ 與 $\pi$,我們仍然可以比較大小 $1.8753 < \pi = 3.1415...$ 故可以發現我們有辦法對 "純量" 做明確的比大小,WHY? 因為前述例子中 $3$, $5$, $1.8753$ or $\pi$ 其各自的大小有辦法被 "measure "! 但是如果是現在考慮的是一組數字 我們如何去measure 其大小呢?? 比如說 \[x:=[1, -2, 0.1, 0 ]^T \]上式的大小該是多少? 是 $1$? $-2$? $0.1$??? 再者如果更過分一點,我們考慮一個矩陣 \[A = \left[ {\begin{array}{*{20}{c}} 1&2\\ 3&4 \end{array}} \right] \],想要知道這個矩陣的大小又該怎麼辦?? 是 $1$ ? $2$ 還是 $4$ ?..其實現階段我們說不清楚。 也正是如此,可以發現我們確實需要新的 "長度" 的定義來幫助我們如何去 measure 矩陣/向量/甚至是函數的大小。 故此,我們首先定義甚麼是Norm,(也就是把 "長度" or "大小" 的本質抽離出來) ================== Definition: Norm 考慮 $V$ 為一個向量空間(Vector space),則我們說  Norm 為一個函數 $||\cdot|| : V \rightarrow \mathbb{R}$ 且滿足下列性質