謝宗翰的隨筆 : [機率論] 淺談機率公理與基本性質

機率公理(Axioms of probability) 是由俄國數學家 Andrey Kolmogorov (1903-1987) 建立。我們的目的主要是簡介此公理系統並進而檢驗由此公理系統所衍生的一些性質。

閱讀前建議具備基礎集合論概念。
讀者可參閱此文：[整理] 基礎集合論的數學語言(1) - Set Operations

再談之間機率公理之前我們先思考兩個隨機實驗：

從閉區間 $[0,1]$ 之中任選一個數字
做無限次的丟銅板實驗

上述兩個實驗，我們每做一次紀錄其實驗結果 $\omega$，並將每次的輸出結果收集起來，此結果形成一個 樣本空間(sample space) $\Omega$。

對實驗1 而言，樣本空間即為 $ \Omega :=[0,1]$ ，其實驗結果記做 $\omega$

對於實驗2，我們可以定義樣本空間為
\[
\Omega_\infty := \{ \text{the set of infinite sequences of Heads' and Tail's}\}
\] 樣本輸出結果 $\omega = \omega_1 \omega_2 ...$ 其中 $\omega_n$ 為第 $n$ 次丟銅版的結果。

那麼如何對上述樣本空間中發生的 "事件" 定義 "機率" 呢? 我們需要機率空間(Probability space) 的概念：

=====================
Definition: Probability Space
一個機率空間 (Probability space) 為一個三元素組成的集合記做 $(\Omega, \cal{F}, P)$。其中 $\Omega$ 定義為實驗結果所形成的非空集合（又稱為樣本空間），$\cal F$ 為事件(or 多個事件) 形成的集合，而 $P$ 為一個函數 $P : \cal{F} \rightarrow [0,1]$ 用作指定對應事件的機率。
====================

Comment:
上述定義提及 $\cal{F}$ 又稱 $\sigma$-algebra or $\sigma$-field 滿足下列條件
(i) 對任意子集合 $A \subset \Omega$，若 $A \in \cal{F}$，則 $A^C \in \cal{F}$
(ii) 對任意 countable 子集 $A_1,A_2,... \in \Omega$，若 $A_i \in \cal{F},\;\; \forall i$ 則其 union $A_1 \cup A_2 \cup ... \in \cal{F}$
(iii) $\emptyset \in \cal{F}$ 且 $\Omega \in \cal{F}$

有了上述想法，我們可以開始討論機率公理：

============================
機率公理(Axioms of Probability)：
給定任何 非空集合 $\Omega$ 為 樣本空間(Sample space)，接著我們定義一個函數 $P$ 在上述樣本空間 $\Omega$ 的子集合 $\cal F$ 上。則我們稱此函數 $P$ 為一個 機率測度 (Probability Measure) 若此函數能(同時)滿足下列四條公理

空集合 $\emptyset$ 稱為 不可能發生的事件(Impossible event)，此不可能發生的事件(樣本空間上的子集合) 機率為 $0$，亦即 $P(\emptyset)=0$.

(非負性質) 機率 $P$ 為非負值，亦即對任意事件 $A$而言，$P(A) \geq 0$.

(可數加法性質) 若 $A_1, A_2, ...$ 為兩兩互斥事件 (pairwise disjoint or mutually exclusive)，也就是說對任意 $n \neq m$, $A_n \displaystyle \bigcap A_m = \emptyset $；則

$P(\bigcup_{n=1}^{\infty} A_n) = \displaystyle \sum_{n=1}^{\infty} P(A_n)$

整個樣本空間的機率被稱作 確定事件(sure event) ，此事件發生之機率為1；亦即 $P(\Omega) =1$。

注意到若一個事件 $A \neq \Omega$ 但滿足 $P(A)=1$ 我們說此事件 $A$ 為幾乎確定事件(almost-sure event)
============================

Comments:
1. 事實上所謂的公理就是"你我在理性上認為是對的or直接同意的陳述，換句話說，我們可以把公理看成是無法被證明對錯，但(在你我的理性上)被假設為不證自明的一個命題

對於公理1，其實非常直覺，不可能發生的事件 <=> 發生機率為0 (0% 發生)
對於公理4，一定發生的事件 <=> 發生機率為1 (100% 發生)
對於公理2，任意事件發生的機率應該是在0~1之間(非負) (0~100%之間)
對於公理3，可看成若事件本身互斥 (EX: 比如說丟一枚銅板一次，不可能同時出現正面又出現反面，我們就說出現正面與出現反面的事件為互斥事件)；則這麼一來，所有可能發生的事件可以看成個別相加。

2. 注意! 機率測度本質上是一個 "函數" (吃事件吐出某個介於 0到1的 " 數值" ) ；亦即考慮機率空間為 $(\Omega, \mathcal{F}, P)$ 則機率測度定義為
$P : \mathcal{F} \rightarrow [0,1]$

其中 $ \mathcal F$ 為 $\Omega$ 的子集合。 (一般稱 $\mathcal{F} $ 為 $\sigma$ - algebra)；且 $\mathcal{F}$ 中的元素稱為事件 "event:"。
對 $\sigma$-algebra 有一點興趣的讀者可以前往閱讀此篇：
[測度論] Sigma Algebra 與 Measurable function 簡介

以下我們介紹一些機率公理的衍生性質：

定義機率空間 $(\Omega, \mathcal{F}, P)$，$A \in \mathcal{F}$ 為事件。則我們有以下結果

FACT 1 : $P(A^c) = 1 - P(A)$
Proof:
首先觀察 $\Omega = A \cup A^c$ 且 $A $ 與 $A^c$ disjoint。故由 $P(\Omega)= 1$，可知道
\[\begin{array}{l}
\underbrace {P(\Omega )}_{ = 1} = P(A \cup {A^c}) = P(A) + P({A^c})\\
\Rightarrow 1 = P(A) + P({A^c})\\
\Rightarrow P({A^c}) = 1 - P(A) \ \ \ \ \square
\end{array}\]

FACT2: (Inclusion-Exclusion Formula)
考慮兩事件 $A,B \in \mathcal{F}$，則我們有
\[
P(A \cup B) = P(A) + P(B) - P(A \cap B)
\]Proof:
首先觀察 \[\left\{ \begin{array}{l}
A = \left( {A \cap {B^c}} \right) \cup \left( {A \cap B} \right)\\
B = \left( {B \cap {A^c}} \right) \cup \left( {A \cap B} \right)
\end{array} \right.\]且上述兩事件 $A,B$ 各自被表為 disjoint union，故其對應的機率為
\[\left\{ \begin{array}{l}
P\left( A \right) = P\left( {A \cap {B^c}} \right) + P\left( {A \cap B} \right)\\
P\left( B \right) = P\left( {B \cap {A^c}} \right) + P\left( {A \cap B} \right)
\end{array} \right.
\]現在觀察
\[\begin{array}{l}
\left( {A \cup B} \right) = \left( {A \cap {B^c}} \right) \cup \left( {A \cap B} \right) \cup \left( {B \cap {A^c}} \right)\\
\Rightarrow P\left( {A \cup B} \right) = \underbrace {P\left( {A \cap {B^c}} \right)}_{ = P\left( A \right) - P\left( {A \cap B} \right)} + P\left( {A \cap B} \right) + \underbrace {P\left( {B \cap {A^c}} \right)}_{ = P\left( B \right) - P\left( {A \cap B} \right)}\\
\Rightarrow P\left( {A \cup B} \right) = P\left( A \right) + P\left( B \right) - P\left( {A \cap B} \right) \ \ \ \ \square
\end{array}\]

FACT3: (Monotonicity Property)
考慮兩事件 $A,B \in \mathcal{F}$，若 $A \subset B$ 則
\[
P(A) \le P(B)
\]Proof:
由 $A \subset B$ 可推知 $B = A \cup {(B \backslash A)}$ 且 $A$ 與 $B \backslash A$ 為 disjoint，故
\[P\left( B \right) = P\left( A \right) + \underbrace {P\left( {B\backslash A} \right)}_{ \ge 0} \ge P\left( A \right) \ \ \ \ \square
\]

FACT4: (Subadditivity)
考慮 countable 事件 $A_n \in \mathcal{F}, \; \forall \; n \in \mathbb{N}$，則
\[P\left( {\bigcup\limits_{n = 1}^\infty {{A_n}} } \right) \le \sum\limits_{n = 1}^\infty {P\left( {{A_n}} \right)} \]
Proof:
觀察事件 $\bigcup\limits_{n = 1}^\infty {{A_n}} = {A_1} \cup \left( {{A_2} \cap A_1^c} \right) \cup \left( {{A_3} \cap A_2^c \cap A_1^c} \right) \cup ...$ 。注意到我們將 countable union 事件 $\bigcup\limits_{n = 1}^\infty {{A_n}} $ 改寫成 disjoint unions，故
\[\begin{array}{l}
\Rightarrow P\left( {\bigcup\limits_{n = 1}^\infty {{A_n}} } \right) = P\left( {{A_1}} \right) + P\left( {{A_2} \cap A_1^c} \right) + P\left( {{A_3} \cap A_2^c \cap A_1^c} \right) + ...\\
\begin{array}{*{20}{c}}
{}&{}&{}&{}&{}&{}&{}
\end{array} \le P\left( {{A_1}} \right) + P\left( {{A_2}} \right) + P\left( {{A_3}} \right) + ... \square
\end{array}\]

FACT5: ( Continuity)
我們稱機率測度 $P$ 對 monotone sequence of events $\{A_n\}$ 連續若下列任一情況成立：
(i) 若 $A_n \uparrow A$ 且 $A_n \in \mathcal{F}$ 則 $P(A_n) \uparrow P(A)$
(ii) 若 $A_n \downarrow A$ 且 $A_n \in \mathcal{F}$ 則 $P(A_n) \downarrow P(A)$

Proof:
我們只證明 (i)：
由於 monotone sequence of events $\{A_n\}$，且 $An \uparrow A$，我們可設
\[{A_1} \subset {A_2} \subset {A_3} \subset ... \subset {A_n} \subset ...
\]接著我們定義新的事件集合 $B_1 := A_1, B_2 := A_1 \backslash A_2, ..., B_n := A_n \backslash A_{n-1}$ 則我們有以下結果
\[\bigcup\limits_{i = 1}^n {{B_i} \equiv {A_n}} ;\begin{array}{*{20}{c}}
{}
\end{array}\bigcup\limits_{i = 1}^\infty {{B_i}} = \bigcup\limits_{i = 1}^\infty {{A_i} = A}
\]故現在觀察
\[\begin{array}{l}
P\left( A \right) = P\left( {\bigcup\limits_{i = 1}^\infty {{B_i}} } \right) = \sum\limits_{i = 1}^\infty {P\left( {{B_i}} \right)} \\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \mathop {\lim }\limits_{n \to \infty } \sum\limits_{i = 1}^n {P\left( {{B_i}} \right)} = \mathop {\lim }\limits_{n \to \infty } P\left( {\bigcup\limits_{i = 1}^n {{B_i}} } \right)\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} = \mathop {\lim }\limits_{n \to \infty } P\left( {{A_n}} \right)
\end{array}\]

謝宗翰的隨筆

12/07/2013

[機率論] 淺談機率公理與基本性質

沒有留言:

張貼留言

[機率論] 三角陣列

搜尋此網誌

12/07/2013

[機率論] 淺談機率公理 與 基本性質

沒有留言:

張貼留言

[機率論] 三角陣列

[機率論] 淺談機率公理與基本性質