顯示具有 Cauchy-Schwarz Inequality 標籤的文章。 顯示所有文章
顯示具有 Cauchy-Schwarz Inequality 標籤的文章。 顯示所有文章

3/21/2017

[基礎機率論] 兩隨機變數的 共變異 與 相關性

在機率論的討論中,很多時候我們需要考慮多個隨機變數,一種情況是這些多個隨機變數彼此互為獨立,那麼其相關的數學運算可以被大幅簡化。但是若多個隨機變數彼此之間有一定程度的相關性,是否有一種合適的量化方法來衡量呢?以下我們給出所謂共變異的概念:


==============
Definition: 令 $X,Y$ 為兩隨機變數各自具備 有限期望值 $E[X],E[Y]$ 與有限變異數 $\sigma_X, \sigma_Y$ ,則我們可定義此組隨機變數 之共變異 (covariance),記作 $\sigma_{XY}$,表為:
\[
\sigma_{XY} := E[(X-E[X])(Y-E[Y])]
\]==============

Comments:
1. [對稱性質]: 由上述定義,讀者應不難看出 $\sigma_{XY} = \sigma_{YX}$

2. [共變異數不必恆為正] :由上述定義,透過簡單的運算可得到
\[{\sigma _{XY}} = E\left[ {XY} \right] - E\left[ X \right]E\left[ Y \right]\]注意到此式為兩項相減,故暗示了 共變異數 可能為正值 亦可能為負值。

3. 上述對於 $X,Y$ 具有有限期望值與有限變異之條件可簡寫為 $X,Y \in L^2$ 其中 $L^2$ 為由所有隨機變數滿足 $E[X^2]<\infty$ 所組成之函數空間。為求簡便起見,以下我們討論涉及 $L^2$ 之處皆以 有限期望值 與有限變異 做為等價之論述。有興趣讀者請參閱 本 Blog 其他相關文章或者查閱相關機率論/隨機過程之教材。

4. 有部分文獻之作者習慣將共變異數 用符號 $Cov(X,Y)$ 取代 $\sigma_{XY}$,端看個人習慣與喜好。

5. 一但兩隨機變數之共變異被定義,那麼給定多個隨機變數,比如說 $X_1,X_2,...,X_n$。我們亦可求其兩兩成對之共變異,舉例而言,若欲求 $X_i, X_j$ 之共變異 (其中 $i,j \in \{1,2,...,n\}$ ) 即為
$$
\sigma_{ij} :=  E[ (X_i- E[X_i]) (X_j = E[X_j])]
$$
另外當 $i =j$ 讀者可自行驗證上述共變異退化為變異數。



一旦定義了共變異,我們可接著引入所謂 相關性(correlation) 的概念:
==============
Definition:
當 $\sigma_{XY} = 0$ 我們說 隨機變數 $X,Y$ 彼此之間互 不相關
當 $\sigma_{XY}>0$ 我們說 隨機變數 $X,Y$ 彼此之間為 正相關
當 $\sigma_{XY} <0$ 我們說 隨機變數 $X,Y$ 彼此之間為 負相關
==============


一但有了共變異,第一個立即的問題便是此共變異與原本各自變異之間的關係是什麼?以下 FACT 對此問題給出回答:

=============
FACT: 對任意 $X,Y \in L^2$,其共變異數之上界可表為
$$
|\sigma_{XY}| \leq \sigma_X \sigma_Y
$$=============
Proof: 首先觀察
\[{\sigma _{XY}} = E\left[ {\left( {X - E\left[ X \right]} \right)\left( {Y - E\left[ Y \right]} \right)} \right]\]現在回憶 Cauchy-Schwarz Inequality :對任意 $U,V \in L^2$ 之隨機變數, \[\left| {E\left[ {UV} \right]} \right| \leqslant \sqrt {E\left[ {{U^2}} \right]} \sqrt {E\left[ {{V^2}} \right]} \]故若我們令 $U:= X-E[X]$ 且 $V:= Y-E[Y]$ 則應用上述 Cauchy-Schwarz Inequality 立刻得到
\begin{align*}
  \left| {{\sigma _{XY}}} \right| &= \left| {E\left[ {\left( {X - E\left[ X \right]} \right)\left( {Y - E\left[ Y \right]} \right)} \right]} \right| \hfill \\
   & \leq \sqrt {E\left[ {{{\left( {X - E\left[ X \right]} \right)}^2}} \right]} \sqrt {E\left[ {{{\left( {X - E\left[ X \right]} \right)}^2}} \right]}  \hfill \\
  & = {\sigma _X}{\sigma _Y}. \;\;\;\;\;\;\; \square
\end{align*}

Comments:
一般而言,若 $\sigma_{XY} = \sigma_X \sigma_Y$ 我們稱 $X,Y$ 為 完全相關 (perfectly correlated),反之若  $\sigma_{XY} = - \sigma_X \sigma_Y$ 則稱 $X,Y$ 為完全負相關(perfectly negative correlated)。


在統計學中常用與指出相關性的指標稱作 相關係數 (correlation coefficient) ,此係數可以由前述的共變異數與變異數直接定義如下:

=================
Definition: Correlation Coefficient of $X$ and $Y$
Correlation Coefficient of $X$ and $Y$, 記作 $\rho_{XY}$, 滿足
\[{\rho _{XY}}: = \frac{{{\sigma _{XY}}}}{{{\sigma _X}{\sigma _Y}}}
\]=================

Comment: 注意到由前述 FACT 可知 $-\sigma_X \sigma_Y \leq \sigma_{XY} \leq \sigma_X \sigma_Y$ 故
\[
-1 \leq \rho_{XY} \leq 1
\]



----附註---
與上述的相關係數有關的內容,有時候會定義所謂 相關函數 (correlation function):

Definition: 令 $X,Y$ 為兩隨機變數,則我們定義 Correlation function between $X$ and $Y$  為  $E[XY]$

Comment:
1. correlation 決定了兩隨機變數何時具有線性相關。
2. 上述 correlation 事實上可視為 $L^2$ 空間之內積運算,在此不贅述。


Example: 
令 $X$ 為具有 mean $=0$ 與 variance $=1$ 的隨機變數,現在令 $Y := 2X$,試求  correlation between $X$ and $Y$
Solution
由定義出發,我們計算 $E[XY] = E[X 2X] = 2E[X^2]$。因為 $X$ 具有 unit variance 由 variance 定義可知 $Var(X) = E[X^2] - (E[X])^2$ 亦即
\[\begin{array}{l}
Var(X) = E[{X^2}] - {(E[X])^2}\\
 \Rightarrow 1 = E[{X^2}] - 0\\
 \Rightarrow E[{X^2}] = 1
\end{array}\]
故 $E[XY]  = 2E[X^2] =2$

11/26/2015

[數學分析] 內積空間的不等式 Cauchy-Schwarz Inequality 與 Triangular Inequality

==============================
Theorem: (Cauchy-Schwarz Inequality) 
令 $V$ 為實數內積空間,且  ${\bf u}, {\bf v} \in V$ 則\[
|({\bf u}, {\bf v})| \le ||{\bf u}|| \; ||{\bf v}||
\]==============================


先看幾個例子
Example 1: 歐幾里德平面空間對應的 柯西不等式 
$V:=\mathbb{R}^2$ 且配備標準內積 $({\bf u}, {\bf v}) := {\bf u}^T {\bf v}$,現令 ${\bf u}:=[u_1\;\;u_2]^T; \; {\bf v}:=[v_1\;\;v_2]^T$ 則上述的 Cauchy-Schwarz Inequality 可表為
\[\begin{array}{l}
\left| {\left( {{\bf{u}},{\bf{v}}} \right)} \right| \le \left\| {\bf{u}} \right\|\left\| {\bf{v}} \right\|\\
 \Rightarrow {\left| {{{\bf{u}}^T}{\bf{v}}} \right|^2} \le \left( {{{\bf{u}}^T}{\bf{u}}} \right)\left( {{{\bf{v}}^T}{\bf{v}}} \right)\\
 \Rightarrow {\left| {{u_1}{v_1} + {u_2}{v_2}} \right|^2} \le \left( {u_1^2 + u_2^2} \right)\left( {v_1^2 + v_2^2} \right)
\end{array}\]

Example 2: 有限維歐幾里德空間對應的 柯西不等式
$V:=\mathbb{R}^n$ 且配備標準內積 $({\bf u}, {\bf v}) := {\bf u}^T {\bf v}$,現令 ${\bf u}:=[u_1,...,\;\;u_n]^T; \; {\bf v}:=[v_1,...,\;\;v_n]^T$ 則上述的 Cauchy-Schwarz Inequality 可表為
\[\begin{array}{*{20}{l}}
{\left| {\left( {{\bf{u}},{\bf{v}}} \right)} \right| \le \left\| {\bf{u}} \right\|\left\| {\bf{v}} \right\|}\\
{ \Rightarrow {{\left| {{{\bf{u}}^T}{\bf{v}}} \right|}^2} \le \left( {{{\bf{u}}^T}{\bf{u}}} \right)\left( {{{\bf{v}}^T}{\bf{v}}} \right)}\\
{ \Rightarrow {{\left| {{u_1}{v_1} + {u_2}{v_2} + ... + {u_n}{v_n}} \right|}^2} \le \left( {u_1^2 + u_2^2 + ... + u_n^2} \right)\left( {v_1^2 + v_2^2 + ... + v_n^n} \right)}
\end{array}\]

Example 3: 無窮維 實數連續函數空間 對應的 柯西不等式
$V:=C[0,1]$ 且配備內積 $(f(t), g(t)) := \int_0^1 f(t) g(t) dt$,現令 ${\bf u}:=f(t); \; {\bf v}:=g(t)$ 則上述的 Cauchy-Schwarz Inequality 可表為
\[\begin{array}{l}
\left| {\left( {f\left( t \right),g\left( t \right)} \right)} \right| \le \left\| {f\left( t \right)} \right\|\left\| {g\left( t \right)} \right\|\\
 \Rightarrow {\left| {\int_0^1 {f\left( t \right)g\left( t \right)dt} } \right|^2} \le \left( {\int_0^1 {{f^2}\left( t \right)dt} } \right)\left( {\int_0^1 {{g^2}\left( t \right)dt} } \right)
\end{array}\]

Example 4: 實數矩陣空間對應的柯西不等式
令 $V:= M_{n \times n}$ 且配備內積 $(A, B) := tr(B^T A)$ 現令 ${\bf u}:=A; \; {\bf v}:=B$ 為 $n \times n$ 矩陣,則上述的 Cauchy-Schwarz Inequality 可表為
\[\begin{array}{*{20}{l}}
{\left| {\left( {{\bf{u}},{\bf{v}}} \right)} \right| \le \left\| {\bf{u}} \right\|\left\| {\bf{v}} \right\|}\\
{ \Rightarrow {{\left| {tr\left( {{B^T}A} \right)} \right|}^2} \le tr\left( {{A^T}A} \right)tr\left( {{B^T}B} \right)}
\end{array}\]

Example 5: 隨機變數所成的 $L^2$ 空間之柯西不等式:
令 $V:= L^p :=\{X: E[|X|^2] < \infty\}$ 且配備內積 $(X,Y) := E[XY]$,其中 $X,Y$ 為隨機變數,$E[\cdot]$ 表期望值。現令 ${\bf u} := X$ 且 ${\bf v} := Y$ 則上述的 Cauchy-Schwarz Inequality 可表為
\begin{align*}
  & \left| {\left( {{\mathbf{u}},{\mathbf{v}}} \right)} \right| \leq \left\| {\mathbf{u}} \right\|\left\| {\mathbf{v}} \right\| \hfill \\
 &  \Rightarrow \left| {E\left[ {XY} \right]} \right| \leq \left\| X \right\|\left\| Y \right\| \hfill \\
  & \Rightarrow \left| {E\left[ {XY} \right]} \right| \leq \sqrt {E\left[ {{X^2}} \right]} \sqrt {E\left[ {{Y^2}} \right]}  \hfill \\
\end{align*}



Comments:
1.上述幾個例子展示了儘管所表現的樣式非常不同,但從抽象化觀點而言是同一件事情。
2. 柯西等式何時成立?

以下我們給出 Cauchy-Schwarz Inequality 的證明,此證明頗具巧思有興趣的讀者可細細品味。

Proof of Cauchy-Schwarz Inequality
令 $c \in \mathbb{R}^1$ 現在觀察
\[\begin{array}{l}
\underbrace {\left( {{\bf{u}} - c{\bf{v}},{\bf{u}} - c{\bf{v}}} \right)}_{ = {{\left\| {{\bf{u}} - c{\bf{v}}} \right\|}^2}} = \left( {{\bf{u}},{\bf{u}}} \right) + \left( { - c{\bf{v}},{\bf{u}}} \right) + \left( {{\bf{u}}, - c{\bf{v}}} \right) + \left( { - c{\bf{v}}, - c{\bf{v}}} \right)\\
 = \left( {{\bf{u}},{\bf{u}}} \right) - c\left( {{\bf{v}},{\bf{u}}} \right) - c\left( {{\bf{u}},{\bf{v}}} \right) + {c^2}\left( {{\bf{v}},{\bf{v}}} \right)\\
 = \left( {{\bf{u}},{\bf{u}}} \right) - 2c\left( {{\bf{u}},{\bf{v}}} \right) + {c^2}\left( {{\bf{v}},{\bf{v}}} \right) \;\;\;\; (*)
\end{array}\]
若 ${\bf{v}} \ne 0$ 則 $({\bf v},{\bf v})>0$ 我們可取 \[c: = \frac{{\left( {{\bf{u}},{\bf{v}}} \right)}}{{\left( {{\bf{v}},{\bf{v}}} \right)}}\]將此 $c$ 帶入 $(*)$ 可得
\[\begin{array}{l}
{\left\| {{\bf{u}} - c{\bf{v}}} \right\|^2} = \left( {{\bf{u}},{\bf{u}}} \right) - 2c\left( {{\bf{u}},{\bf{v}}} \right) + {c^2}\left( {{\bf{v}},{\bf{v}}} \right)\\
 = \left( {{\bf{u}},{\bf{u}}} \right) - 2\frac{{\left( {{\bf{u}},{\bf{v}}} \right)}}{{\left( {{\bf{v}},{\bf{v}}} \right)}}\left( {{\bf{u}},{\bf{v}}} \right) + {\left( {\frac{{\left( {{\bf{u}},{\bf{v}}} \right)}}{{\left( {{\bf{v}},{\bf{v}}} \right)}}} \right)^2}\left( {{\bf{v}},{\bf{v}}} \right)\\
 = \left( {{\bf{u}},{\bf{u}}} \right) - \frac{{{{\left( {{\bf{u}},{\bf{v}}} \right)}^2}}}{{\left( {{\bf{v}},{\bf{v}}} \right)}}
\end{array}\]但由於 ${\left\| {{\bf{u}} - c{\bf{v}}} \right\|^2} \ge 0$ 故
\[\left( {{\bf{u}},{\bf{u}}} \right) - \frac{{{{\left( {{\bf{u}},{\bf{v}}} \right)}^2}}}{{\left( {{\bf{v}},{\bf{v}}} \right)}} \ge 0 \Rightarrow \left( {{\bf{u}},{\bf{u}}} \right)\left( {{\bf{v}},{\bf{v}}} \right) \ge {\left( {{\bf{u}},{\bf{v}}} \right)^2}\]
上式結果說明在 ${\bf v} \neq 0$ 時 Cauchy-Schwarz Inequality 成立。另外我們回頭檢驗 ${\bf v} = 0$ 的情況,則此時 $\left( {{\bf{u}},{\bf{u}}} \right)\left( {{\bf{v}},{\bf{v}}} \right) \ge {\left( {{\bf{u}},{\bf{v}}} \right)^2}$ 自動滿足。故不論如何我們都有
\[{\left( {{\bf{u}},{\bf{v}}} \right)^2} \le \left( {{\bf{u}},{\bf{u}}} \right)\left( {{\bf{v}},{\bf{v}}} \right)\]至此證畢。$\square$

Comments:
1. 注意到若 ${\bf u} = c {\bf v} $ 則 Cauchy-Schwarz 等式成立。此結果背後蘊含最小平方的最佳化觀點但我們在此不作贅述。
2. 上述 Cauchy-Schwarz Inequality 可引出 Triangular Inequality

Corollary:  Triangular Inequality
令 $V$ 為實數內積空間,若 ${\bf u}, {\bf v} \in V $ 則
\[
||{\bf u} + {\bf v}|| \le ||{\bf u}|| + ||{\bf v}||
\]
Proof:
觀察
\[\begin{array}{l}
||{\bf{u}} + {\bf{v}}|{|^2} = \left( {{\bf{u}} + {\bf{v}},{\bf{u}} + {\bf{v}}} \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \left( {{\bf{u}},{\bf{u}}} \right) + \left( {{\bf{v}},{\bf{u}}} \right) + \left( {{\bf{u}},{\bf{v}}} \right) + \left( {{\bf{v}},{\bf{v}}} \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \left( {{\bf{u}},{\bf{u}}} \right) + 2\left( {{\bf{v}},{\bf{u}}} \right) + \left( {{\bf{v}},{\bf{v}}} \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = {\left\| {\bf{u}} \right\|^2} + 2\left( {{\bf{v}},{\bf{u}}} \right) + {\left\| {\bf{v}} \right\|^2}\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \le {\left\| {\bf{u}} \right\|^2} + 2\left| {\left( {{\bf{v}},{\bf{u}}} \right)} \right| + {\left\| {\bf{v}} \right\|^2}
\end{array}\]由 Cauchy-Schwarz Inequality 我們有 $
|({\bf u}, {\bf v})| \le ||{\bf u}|| \; ||{\bf v}||$ 故
\[\begin{array}{l}
||{\bf{u}} + {\bf{v}}|{|^2} \le {\left\| {\bf{u}} \right\|^2} + 2\left| {\left( {{\bf{v}},{\bf{u}}} \right)} \right| + {\left\| {\bf{v}} \right\|^2}\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \le {\left\| {\bf{u}} \right\|^2} + 2||{\bf{u}}||\;||{\bf{v}}|| + {\left\| {\bf{v}} \right\|^2}\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \le {\left( {\left\| {\bf{u}} \right\| + \left\| {\bf{v}} \right\|} \right)^2}
\end{array}\]對兩邊同開根號我們得到
\[
||{\bf u} + {\bf v}|| \le ||{\bf u}|| + ||{\bf v}||
\]即為所求 $\square$

Comment:
若 ${\bf u}, {\bf v}$ 互為正交,亦即 $({\bf u},{\bf v}) = 0$ 則我們有
\[
||{\bf u} + {\bf v}||^2 = ||{\bf u}||^2 + ||{\bf v}||^2
\]上述等式 可視為 畢氏定理 在向量空間中的推廣。

[Claude] 國小數學加減乘除法計算小遊戲:數學怪獸大亂鬥

心血來潮用 Anthropic Claude Opus 4.6 做的簡單國小數學乘除法計算小遊戲,感嘆AI工具之強大與便利。原本可能要耗時幾天的工作轉眼就完成,時代的巨輪確實在飛速轉動。  數學怪獸大亂鬥(Math Monster Brawl)對戰的國小數學 加減乘除 小遊戲連結...