跳到主要內容

[機率論] 淺論獨立性質 與 Dynkin's pi-lambda 定理

直觀上,說事件獨立表示事件過去發生的歷史不會影響未來的結果。比如說我們考慮某隨機試驗為 投擲公平銅板三次,其結果 出現正面或者反面 不影響 下一次試驗出現正面或者反面的機率。則我們可將此投擲銅板的隨機試驗視為獨立事件。


以下我們給出各種獨立性的定義:

給定機率空間 $(\Omega, \mathcal{F}, P)$。
Definition: Independence of Two Events
我們說兩事件 $A,B \in \mathcal{F}$ 彼此獨立 (A independent of B) 若下列條件成立
\[
P(A \cap B) = P(A)P(B)
\]

Definition: Independence of Two Random Variables
我們說 兩隨機變數 $X, Y$ 從 $(\Omega, \mathcal{F})$ 映射到 $(\mathbb{R},\mathcal{B}_{\mathbb{R}})$彼此獨立,若下列條件成立
對任意 $C, D \in \mathcal{B}_{\mathbb{R}}$
\[
P(X \in C, Y \in D) = P(X \in C, Y \in D)
\]其中 $\mathcal{B}_{\mathbb{R}}$ 為 Borel sigma-algebra。

Definition: Independence of Two Sigma-Algebras
我們說 兩 sigma-algebra $\mathcal{F}, \mathcal{G}$ 彼此獨立,若下列條件成立
對任意 $A \in \mathcal{F}$ 與 $B \in \mathcal{G}$ 我們有
\[
P(A \cap B) = P(A)P(B)
\]

現在我們看個事件獨立的結果:

=========================
FACT: 若事件 $A$, $B$ 為獨立,則 $A$ 與 $B^c$, $A^c$, 以及 $B$ 與 $B^c$, $A^c$ 均為獨立。
=========================
Proof:
在此只證 $A$ 與 $B^c$ 獨立。其餘證法皆雷同不贅述。由於要證  $A$ 與 $B^c$ 獨立,由定義可知我們必須要證明
\[
P(A \cap B^c) = P(A) P(B^c)
\]現在觀察下列事件等價
\[\left\{ {A \cap {B^c}} \right\} = \left\{ {A\backslash \left( {A \cap B} \right)} \right\}
\]且注意到 $A$ 與 $A \cap B$ 彼此 disjointed,故若我們計算其機率可得
\[P(A \cap {B^c}) = P(A\backslash \left( {A \cap B} \right)) = P(A) - P\left( {A \cap B} \right)
\]由於 $A$ 與 $B$ 獨立故 $P(A \cap B) = P(A) P(B)$,將此代入上式可得
\[\begin{array}{l}
 \Rightarrow P(A \cap {B^c}) = P(A) - P\left( {A \cap B} \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}
\end{array} = P(A) - P\left( A \right)P\left( B \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}
\end{array} = P(A)\left[ {1 - P\left( B \right)} \right]\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}
\end{array} = P(A)P\left( {{B^c}} \right) \ \ \ \ \square
\end{array}\]



那麼現在如果超過兩個以上的 事件, 隨機變數 or sigma-algebra, 的話怎麼辦呢?

Definition: Independence of Several Events
我們說事件 $A_1,A_2,...,A_n \in \mathcal{F}$ 彼此獨立 若下列條件成立:
$I \subset\{1,2,...,n\}$
\[P\left( {\bigcap\limits_{i \in I}^n {{A_i}} } \right) = \prod\limits_{i \in I}^n {P({A_i})} \]

Definition: Independence of Several Random Variables
我們說 隨機變數 $X_1,X_2,... X_n $ 從 $(\Omega, \mathcal{F})$ 映射到 $(\mathbb{R},\mathcal{B}_{\mathbb{R}})$彼此獨立,若下列條件成立:
對任意 $i=1,2,...,n$, $B_i \in \mathcal{B}_{\mathbb{R}}$
\[P\left( {\bigcap\limits_{i =1}^n {\left\{ {X \in {B_i}} \right\}} } \right) = \prod\limits_{i =1}^n {P\left( {X \in {B_i}} \right)} \]其中 $\mathcal{B}_{\mathbb{R}}$ 為 Borel sigma-algebra。

Definition: Independence of Several Sigma-Algebras
我們說  sigma-algebra $\mathcal{F_1},\mathcal{F_2},...,\mathcal{F_n}$ 彼此獨立,若下列條件成立:
對任意 $i =1,2,...,n$,  $A_i \in \mathcal{F_i}$ 我們有
\[P\left( {\bigcap\limits_{i =1}^n {{A_i}} } \right) = \prod\limits_{i=1}^n {P({A_i})}
\]

為了找出要 獨立性的充分條件,我們先介紹下面一些術語

===============================
Definition: $\pi$-system $\lambda$-system
我們說 $\mathcal{P}$ 為 $\pi$-system 若下列條件成立
1. $\mathcal{P} \neq \emptyset$
2. 若 $A,B \in \mathcal{P}$ 則 $A \cap B \in \mathcal{P}$

我們說 $\mathcal{L}$ 為 $\lambda$-system 若下列條件成立
1. $\mathcal{L} \neq \emptyset$, $\Omega \in \mathcal{L}$
2. 若 $A \in \mathcal{L}$ 則 $A^c \in  \mathcal{L}$
3. 若 $A_i \in  \mathcal{L}, \;\; \forall i$ 且 $A_i$ disjoint, 則 $\bigcup_i A_i  \in \mathcal{L}$
===============================

Comment: Sigma-algebra 本身即為 $\lambda$-system。讀者可自行確認 Sigma-algebra 定義確實符合  $\lambda$-system。

===============================
Theorem: Dynkin's Pi-Lambda Theorem
若 $\mathcal{P}$ 為 $\pi$-system 且 $\mathcal{L}$ 為 $\lambda$-system 使得 $\mathcal{P} \subset \mathcal{L}$,則 $\sigma(\mathcal{P}) \subset \mathcal{L}$
===============================
Proof: omitted.


我們用下面的幾個 proposition 來驗證如何使用 $\pi-\lambda$ Theorem。首先看看如何檢驗一個集合確實為  $\lambda$-system。

===============================
Proposition: 令 $P_1, P_2$ 為兩個在 $(\Omega, \mathcal{B})$ 上的機率測度。則下列集合
\[
\mathcal{L}:=\{A \in \mathcal{B}: P_1(A) = P_2(A)\}
\]為 $\lambda$-system。
===============================

Proof:
要證明 $\mathcal{L}$ 為$\lambda$-system,由定義可知我們需檢驗下列三項性質都被滿足
1. $\mathcal{L} \neq \emptyset$, $\Omega \in \mathcal{L}$
2. 若 $A \in \mathcal{L}$ 則 $A^c \in  \mathcal{L}$
3. 若 $A_i \in  \mathcal{L}, \;\; \forall i$ 且 $A_i$ disjoint, 則 $\bigcup_i A_i  \in \mathcal{L}$

故我們逐項檢驗如下:
1. 由於 $\Omega \in \mathcal{B}$,且 $P_1(\Omega) = P_2(\Omega)$ 故可知 $\Omega \in \mathcal{L}$ 且 $\mathcal{L} \neq \emptyset$。

2. 若 $A \in \mathcal{L}$,則 $A \in \mathcal{B}$ 且 $P_1(A) = P_2(A)$ 故我們觀察
\[\begin{array}{l}
{P_1}(A) = {P_2}(A) \Rightarrow 1 - {P_1}({A^c}) = 1 - {P_2}({A^c})\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}
\end{array} \Rightarrow {P_1}({A^c}) = {P_2}({A^c})
\end{array}\]亦即 $A^c \in \mathcal{L}$。

3. 若 $A_i \in  \mathcal{L}, \;\; \forall i$ 且 $A_i$ disjoint,則我們有 $P_1(A_i) = P_2(A_i), \;\; \forall i$ 且由於  $A_i$ disjoint ,我們觀察下式
\[{P_1}(\bigcup\limits_i^{} {{A_i}} ) = \sum\limits_i^{} {{P_1}({A_i})}  = \sum\limits_i^{} {{P_2}({A_i})}  = {P_2}(\bigcup\limits_i^{} {{A_i}} )\]亦即  $\bigcup_i A_i  \in \mathcal{L}$。

故綜合以上我們可知 $\mathcal{L}$ 三項條件都滿足,故 $\mathcal{L}$確實為 $\lambda$-system。$\square$


接著我們看看如何使用 Dynkin's pi-lambda theorem。

=================
Corollary
若 $P_1, P_2$ 個別為在 $(\Omega, \mathcal{B})$ 上 的機率測度 且 $\mathcal{P}$ 為 $\pi$-system 使得 對任意 $A \in \mathcal{P}$,$P_1(A) = P_2(A)$,則 對任意 $B \in \sigma(\mathcal{P})$,我們有 $P_1(B) = P_2(B)$。其中 $\sigma(\mathcal{P})$ 表示由 $\mathcal{P}$所產生的最小的 sigma-algebra 。
=================

Proof:
由 先前的 Proposition 可知 $\mathcal{L}:=\{A \in \mathcal{B}: P_1(A) = P_2(A)\} $ 為 $\lambda$-system,且注意到我們假設  $\mathcal{P}$ 為 $\pi$-system 使得 對任意 $A \in \mathcal{P}$,$P_1(A) = P_2(A)$,故 $\mathcal{P} \subset \mathcal{L}$,故利用 Dynkin's $\pi-\lambda$ Theorem:
---
若 $\mathcal{P}$ 為 $\pi$-system 且 $\mathcal{L}$ 為 $\lambda$-system 使得 $\mathcal{P} \subset \mathcal{L}$,則 $\sigma(\mathcal{P}) \subset \mathcal{L}$
---
可知  $\sigma(\mathcal{P}) \subset \mathcal{L}$,亦即對任意 $B \in \sigma(\mathcal{P})$,我們有 $P_1(B) = P_2(B)$。$\square$



============
Theorem: Independence class of sets implies independence of generated sigma-algebra
固定機率空間 $(\Omega, \mathcal{F}, P)$, 設  $\mathcal{A}_1,\mathcal{A}_2,...,\mathcal{A}_n$ 彼此獨立,且 $\mathcal{A}_i$ 為 $\pi$-system,則
\[\sigma(\mathcal{A}_1), \sigma(\mathcal{A}_2), ..., \sigma(\mathcal{A}_n)
\] 亦為彼此獨立。
============

Proof: 我們這邊證明上述結果在 $n=2$ 時候成立。首先固定 $A_2 \in \mathcal{A}_2$,我們建構一集合如下
\[
\mathcal{L}:=\{A\in \mathcal{F}: P(A \cap A_2) = P(A) P(A_2) \}
\]我們現在證明 $\mathcal{L}$ 為一個 $\lambda$-system。故首先檢驗 $\Omega $ 是否落在 $\mathcal{L}$之中。觀察 $\Omega \in \mathcal{F}$ 且 $P(\Omega \cap A_2) = P(A_2) = P(A_2) P(\Omega)$ 故 $\Omega \in \mathcal{L}$

接著我們檢驗 若 $A \in \mathcal{L}$ 中 則 $A^c $ 亦必須落在 $\mathcal{L}$之中。故 $A \in  \mathcal{L}$ 表示 $A \in \mathcal{F}$ 且 \[\begin{array}{l}
P(A \cap {A_2}) = P\left( A \right)P\left( {{A_2}} \right)\\
 \Rightarrow P(\left( {\Omega \backslash {A^c}} \right) \cap {A_2}) = \left[ {1 - P\left( {{A^c}} \right)} \right]P\left( {{A_2}} \right)\\
 \Rightarrow P\left( {\left( {\Omega  \cap {A_2}} \right)\backslash \left( {{A^c} \cap {A_2}} \right)} \right) = P\left( {{A_2}} \right) - P\left( {{A^c}} \right)P\left( {{A_2}} \right)\\
 \Rightarrow P\left( {{A_2}\backslash \left( {{A^c} \cap {A_2}} \right)} \right) = P\left( {{A_2}} \right) - P\left( {{A^c}} \right)P\left( {{A_2}} \right)\\
 \Rightarrow P\left( {{A_2}} \right) - P\left( {{A^c} \cap {A_2}} \right) = P\left( {{A_2}} \right) - P\left( {{A^c}} \right)P\left( {{A_2}} \right)\\
 \Rightarrow P\left( {{A^c} \cap {A_2}} \right) = P\left( {{A^c}} \right)P\left( {{A_2}} \right)
\end{array}\]故可得 $A^c \in \mathcal{L}$。

最後我們檢驗若 $B_1, B_2, ...  \in \mathcal{L}$ 且互為 disjoint,我們要檢驗是否  $\bigcup\limits_{i = 1}^\infty  {{B_i}} \in \mathcal{L}$

故令 $B_1, B_2, ...  \in \mathcal{L}$且互為 disjoint,則我們有 $B_1, B_2, ... \in \mathcal{F}$ 且 $P(B_i \cap A_2) = P(B_i) P(A_2), \;\; \forall i \in \mathbb{N}$ 現在觀察  $\bigcup\limits_{i = 1}^\infty  {{B_i}} \in \mathcal{F}$ 且
\[\begin{array}{l}
P\left( {\left( {\bigcup\limits_{i = 1}^\infty  {{B_i}} } \right) \cap {A_2}} \right) = P\left( {\bigcup\limits_{i = 1}^\infty  {\left( {{B_i} \cap {A_2}} \right)} } \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}
\end{array} = \sum\limits_{i = 1}^\infty  {P\left( {{B_i} \cap {A_2}} \right)}  = P({A_2})\sum\limits_{i = 1}^\infty  {P({B_i})} \\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}
\end{array} = P\left( {\bigcup\limits_{i = 1}^\infty  {{B_i}} } \right)P({A_2})
\end{array}\]亦即 $\bigcup\limits_{i = 1}^\infty  {{B_i}} \in \mathcal{L}$ 。

綜合上述三點我們可以推得 $\mathcal{L}$ 為 $\pi$-system,且由假設可知 $\mathcal{A}_1, \mathcal{A}_2$ 皆為 $\pi$-system 且 $\mathcal{A}_1 \subset \mathcal{L}$ 因為 取任意集合 $A_1 \in \mathcal{A}_1$ 則 由假設$\mathcal{A}_1, \mathcal{A}_2$ 彼此獨立,故 $P(A_1 \cap A_2) = P(A_1) P(A_2)$ 此結果確實滿足 $\mathcal{L}$之要求,故  $\mathcal{A}_1 \subset \mathcal{L}$ 。

現在我們利用 Dynkin's pi-lambda theorem 可知道 $\sigma(\mathcal{A}_1) \subset \mathcal{L}$ 故可推論 $\sigma(\mathcal{A}_1)$ 與 $\mathcal{A}_2$ 互為獨立。

現在推廣上述結果可證得 $\sigma(\mathcal{A}_1)$ 與 $\sigma (\mathcal{A}_2)$ 互為獨立。




============
Theorem: 
設 $\mathcal{F}_{i,j}$, $1 \le i \le n$ 且 $1 \le j \le m(i)$ 互為獨立的 sigma-algebras,且令
\[
\mathcal{G}_i := \sigma(\bigcup_j F_{i,j})
\]則 $\mathcal{G}_1,...,\mathcal{G}_2$ 亦互為獨立。
============
Proof:
我們要證明 sigma-algebras  $\mathcal{G}_1,...,\mathcal{G}_2$ 亦互為獨立。

首先定義集合
\[
\mathcal{A}_i := \{ A_{i,j} \in \mathcal{F}_{i.j} : \bigcap_j A_{i,j} \}
\] 注意到 由於 $\mathcal{F}_{i,j}$ 為 sigma-algebra,可知  $\Omega \in \mathcal{F}_{i,j},\;\; \forall i,j $ ;故若我們取 $A_{i,j} := \Omega$,則 $ \bigcap_j A_{i,j} = \Omega$ 亦即 $\Omega \in \mathcal{A}_i$;且 $\mathcal{A}_i \neq \emptyset$。  $\ \ \ \ (*)$

接著我們檢驗 $\mathcal{A}_i$ 是否為 $\pi$-system: 若  $A_{i,j}, B_{i,j} \in \mathcal{A}_{i,j}$ 則 $A_{i,j} \cap B_{i,j} \in \mathcal{A}_i$ $\ \ \ \ (**)$。故由 $(*)$ 與 $(**)$ 可知 $\mathcal{A}_i$ 為 $\pi$-system。

接著我們試圖要把 $\mathcal{A}_i$ 與我們要證明的 $\mathcal{G}_i$ 關係連結起來,故我們檢驗 $\bigcup_j \mathcal{F}_{i,j} \subset \mathcal{A}_i$:
令 $A_{i,j} \in \mathcal{F}_{i,j}$ 我們要證明  $A_{i,j} \in  \mathcal{A}_i$,現在觀察 $\bigcap_j A_{i,j} = A_{i,j} \cap \Omega \cap \Omega \cap ...$ 故可推得 $A_{i,j} \in \mathcal{A}_i$。亦即 $\bigcup_j \mathcal{F}_{i,j} \subset \mathcal{A}_i$。

再者,若 $A_{i,j} \in \mathcal{A}_i$ 則 $A_{ij} \in \mathcal{F}_{i,j}$ ,由定義可知 $\mathcal{F}_{i,j}$ 互為獨立,故 $\mathcal{A}_i$ 互為獨立。

現在總結手上有的對於 $\mathcal{A}_i$ 結果如下:
1.  $\mathcal{A}_i$ 為 $\pi$-system
2.  $\bigcup_j \mathcal{F}_{i,j} \subset \mathcal{A}_i$
3.  $\mathcal{A}_i$ 互為獨立。

現在由 Theorem: Independence class of sets implies independence of generated sigma-algebra 可知:若 $\mathcal{A}_1,\mathcal{A}_2,...,\mathcal{A}_n$ 彼此獨立,且 $\mathcal{A}_i$ 為 $\pi$-system,則
\[\sigma(\mathcal{A}_1), \sigma(\mathcal{A}_2), ..., \sigma(\mathcal{A}_n)
\] 亦為彼此獨立。

亦即我們得到 $\sigma(\mathcal{A}_i)$ 亦互為獨立。且 $\sigma(\mathcal{A}_i) \supset \mathcal{A}_i \supset \bigcup_j \mathcal{F}_{i,j}$ 故可推知 (由 $ \sigma(\cup_j \mathcal{F}_{i,j})$ 為最小的 sigma-algebra 包含 $\mathcal{F}_{i,j}$)
\[
\sigma(\mathcal{A}_i) \supset \mathcal{G}_i := \sigma(\cup_j \mathcal{F}_{i,j})
\]且由於 $\sigma(\mathcal{A}_i)$ 亦互為獨立,故 $\mathcal{G}_i $ 互為獨立。 $\square$










留言

這個網誌中的熱門文章

[數學分析] 什麼是若且唯若 "if and only if"

數學上的 if and only if  ( 此文不討論邏輯學中的 if and only if,只討論數學上的 if and only if。) 中文翻譯叫做  若且唯若 (or 當且僅當) , 記得當初剛接觸這個詞彙的時候,我是完全不明白到底是甚麼意思,查了翻譯也是愛莫能助,畢竟有翻跟沒翻一樣,都是有看沒有懂。 在數學上如果看到 if and only if  這類的句子,其實是表示一種 雙條件句 ,通常可以直接將其視為" 定義(Definition)" 待之,今天要分享的是這樣的一個句子如何用比較直觀的方法去看他 假設我們現在有 兩個邏輯陳述句 A 與  B. 注意到,在此我們不必考慮這兩個陳述句到底是什麼,想表達什麼,或者到底是否為真(true),這些都不重要。只要知道是兩個陳述即可。 現在,考慮新的陳述:  "A if and only if B" 好了,現在主角登場,我們可以怎麼看待這個句子呢? 事實上我們可以很直覺的把這句子拆成兩部分看待,也就是 "( A if B ) and ( A only if B )" 那麼先針對第一個部分  A if B  來看, 其實這句就是說  if B then A, 更直白一點就是 "if B is true, then A is also true".  在數學上等價可以寫為 "B implies A" .  或者更常用一個箭頭符號來表示 "B $\Rightarrow$  A"  現在針對第二個部分  A only if B 此句意指  "If B is not true, then A is also not true". 所以如果已知 A is true,  那麼按照上句不難推得 B is also true 也就是說  A only if B  等價為 "If A is true then B is also true". 同樣,也可以寫作   "A implies B"   或者用箭頭表示  "A   $\Rightarrow$     B".

[數學分析] 淺談各種基本範數 (Norm)

這次要介紹的是數學上一個重要的概念: Norm: 一般翻譯成 範數 (在英語中 norm 有規範的意思,比如我們說normalization就是把某種東西/物品/事件 做 正規化,也就是加上規範使其正常化),不過個人認為其實翻譯成 範數 也是看不懂的...這邊建議把 Norm 想成長度就好 (事實上norm是長度的抽象推廣), 也許讀者會認為好端端的長度不用,為何又要發明一個 norm 來自討苦吃?? 既抽象又艱澀。 事實上想法是這樣的: 比如說現在想要比較兩個數字 $3$ , $5$ 之間的大小,則我們可以馬上知道 $ 3 < 5 $;同樣的,如果再考慮小數與無理數如 $1.8753$ 與 $\pi$,我們仍然可以比較大小 $1.8753 < \pi = 3.1415...$ 故可以發現我們有辦法對 "純量" 做明確的比大小,WHY? 因為前述例子中 $3$, $5$, $1.8753$ or $\pi$ 其各自的大小有辦法被 "measure "! 但是如果是現在考慮的是一組數字 我們如何去measure 其大小呢?? 比如說 \[x:=[1, -2, 0.1, 0 ]^T \]上式的大小該是多少? 是 $1$? $-2$? $0.1$??? 再者如果更過分一點,我們考慮一個矩陣 \[A = \left[ {\begin{array}{*{20}{c}} 1&2\\ 3&4 \end{array}} \right] \],想要知道這個矩陣的大小又該怎麼辦?? 是 $1$ ? $2$ 還是 $4$ ?..其實現階段我們說不清楚。 也正是如此,可以發現我們確實需要新的 "長度" 的定義來幫助我們如何去 measure 矩陣/向量/甚至是函數的大小。 故此,我們首先定義甚麼是Norm,(也就是把 "長度" or "大小" 的本質抽離出來) ================== Definition: Norm 考慮 $V$ 為一個向量空間(Vector space),則我們說  Norm 為一個函數 $||\cdot|| : V \rightarrow \mathbb{R}$ 且滿足下列性質