跳到主要內容

[測度論] Sigma Algebra 與 Measurable function 簡介

這次要介紹的是 Sigma Algebra 與 可測函數 (Measurable function)。
(在機率論中 隨機變數 (random variable) 即為 可測函數,我們會在本文中稍作介紹 )

在介紹measurable function之前我們需要一些先導概念 (or building block) 來幫助我們。

首先是 空間 (Space) 的概念。
我們說一個 空間 $X$ 其實就是任意(具有某種結構)的集合 (set)。

一般而言牽涉到測度是 因為我們想要在這個空間(集合) 上定義積分,故我們需要加上一些 (額外的) 結構 到這個空間來幫助我們定義積分。也就是所謂的 $\sigma$-algebra 與 測度 (measure)。透過這個結構我們可以來說明什麼是 可測函數。

現在我們先看看空間需要的結構,稱為 sigma-algebra or sigma-field。

以下給出 $\sigma$-algebra的定義:
=============================
首先考慮 空間 $X$ 的子集合(subset),我們將這些子集合 收集起來形成一個集合;定義做$\mathcal{A}$,我們稱 $\mathcal{A}$為 collection of subsets of $X$

Definition : ( $\sigma$-algebra)
假設 $\mathcal{A}$ 為 collection of subsets of $X$ ,則 $\mathcal{A}$為 $\sigma$-algebra (或稱 $\sigma$-field)如果下列三個條件成立:
1. $X \in \mathcal{A}$ 且 $\emptyset \in \mathcal{A}$ (亦即整個space 與 空集合必須落在 $\mathcal{A}$ 中)
2. $A \in \mathcal{A} \Rightarrow A^c \in \mathcal{A}$ (亦即 補集 必須落在 $\mathcal{A}$ 中)
3. 假設 $\{A_i \}$ 為在 $\mathcal{A}$ 中的 可數 集合序列 (countable set of sequence),則其聯集 $\cup_i A_i \in \mathcal{A}$
=============================

Comments: 
1. 在機率論中,$X$ 為 sampled space $\Omega$,$\sigma$-algebra 為事件的集合 (事件為$\Omega$的子集)。
2. 注意到上述條件 (3.),對於不可數集合的聯集並不允許!!,亦即我們無法聯集任意(不可數)多個集合;另外若我們將條件 3 改成只允許 "有限個集合" 聯集,則此時 $\mathcal{A}$ 稱作一個 algebra (NOT $\sigma$-algebra )
4. 對數個 sigma-algebra 取 交集仍為 sigma-algebra。
5. 在機率論中,若樣本空間 $\Omega$ 為可數集合,則我們可以對其上任何子集 $2^{\Omega}$ 皆可 指定對應測度,但若樣本空間為 無窮不可數集合 (uncountable set) , 則我們很有可能無法對其上所有子集 定義對應的測度,但所幸我們可對 $\sigma$-algebra 所產生之子集定義測度,也就是透過 $\sigma$-algebra 的幫助,可以保證當我們做最大限度的集合的操作 (交集/聯集/差集/...) 之下所產生的 $\sigma$-algebra 的子集皆可被指定測度。


以下我們看幾個 $\sigma$-algebra 的例子
----
Example:
令 $X$ 為任意非空集合
1. 其 power set $\mathcal{P}(X)$ 與 $\{\emptyset, X \}$ 都為 $\sigma$ algebra。

2. 若 $X$ 為 uncountable,則下列集合
\[
 \mathcal{A} := \{E \subset X: \text{$E$ is countable or $E^C$ is countable} \}
\]為 $\sigma$- algebra。

3. 若 $A$ 為 $X$ 中非空子集,則
\[
\mathcal{A} = \{\emptyset, X, A^C, A \}
\]為  $\sigma$- algebra。

4. 若 $X $ 為 可數集合 (e.g., $X = \mathbb{N}$),則下列集合
\[
 \mathcal{A} := \{E \subset X: \text{$E$ is finite or $E^C$ is finite} \}
\]不為 $\sigma$- algebra。
---

========================
Sigma-algebra generated by a set 
若 $\mathcal{E} \subset \mathcal{P}(X)$,其中 $\mathcal{P}(X)$ 為 $X$ 的 power set (表所有 $X$ 的子集), 則存在一個 smallest sigma-algebra $\sigma(E)$ 包含 $\mathcal{E}$。亦即 \[
\sigma(\mathcal{E}) = \cap\{ \mathcal{C}: \mathcal{E} \subset \mathcal{C} \text{  and  } \mathcal{C} \text{ is a $\sigma$-algebra}\}
\]========================

Proof
我們要證明 $\sigma(\mathcal{E})$ 為 sigma-algebra。故由 sigma-algebra 定義
首先檢驗 $\emptyset$ 與 $X$ 是否落在  $\sigma(\mathcal{E})$ 中:由於
 \[
\sigma(\mathcal{E}) = \cap\{ \mathcal{C}: \mathcal{E} \subset \mathcal{C} \text{  and  } \mathcal{C} \text{ is a $\sigma$-algebra}\}
\]且在 $\sigma(\mathcal{E})$ 中的每一個元素 $ \mathcal{C}$ 都為 sigma-algebra,由定義可知必定都具有  $\emptyset$ 與 $X$ ,故可推知 $\emptyset \in \sigma(\mathcal{E})$ 與 $X \in \sigma(\mathcal{E})$。

接著我們檢驗 補集性質:我們讓 $A \in \sigma(\mathcal{E})$ ,則 $A \in \mathcal{C}, \; \forall \mathcal{C} \in \sigma(\mathcal{E})$ 又因為 $ \mathcal{C}$ 都為 sigma-algebra,故 $A^C \in \mathcal{C}, \; \forall \mathcal{C} \in \sigma(\mathcal{E})$ 亦即
\[
A^C \in \sigma(\mathcal{E})
\]
最後我們檢驗 可數聯集性質:讓 $\{A_i \}$ 為在 $\sigma(\mathcal{E})$ 中的 可數 集合序列 (countable set of sequence),則 $A_i \in C,\; \forall C \in \sigma(\mathcal{E})$故我們若取聯集
\[\bigcup\limits_i^{} {{A_i}}  \in \sigma(\mathcal{E}) \ \ \ \ \square
\]



Example: Sigma-algebra generated by a family of open sets
令 $X$ 為 metric space。
若 $\sigma$-algebra 是由一堆  $X$ 中的 open sets 所形成的集合所產生,則我們稱此 $\sigma$-algebra 為 Borel $\sigma$-algebra 記做 $\mathcal{B}_X$。且 $\mathcal{B}_X$ 的元素我們稱為 Borel sets 且由於其為透過 open sets 所產生,故 $\mathcal{B}_X$ 包含 opne sets,closeed sets, 可數多個交集或者連集的open and closed sets。。


令 $X := \mathbb{R}$,則我們可以取 $\mathbb{R}$ 上的 open sets 建構 Borel sigma algebra $\mathcal{B}_{\mathbb{R}}$


有了 sigma-algebra 作為空間的結構,我們便可以定義我們需要 (用作之後定義積分) 的空間,稱為 可測空間 (Measurable Space)

=============================
Definition (Measurable Space 與 Measurable sets)
若 $X$ 為space 且 $\mathcal{A}$ 為 $\sigma$-algebra 滿足上述定義,則我們稱 有序配對  $(X, \mathcal{A})$ 為一個 Measurable Space。

$\sigma$-algebra  $\mathcal{A}$ 中的元素稱為 Measurable sets。 (亦即 $\sigma$-algebra 為Measurable set)
=============================

有了以上定義我們便可以介紹甚麼是可測函數

現在假設有兩個 Measurable space $(X, \mathcal{A})$ 與 $(Y, \mathcal{B})$,並考慮有一個函數 $f : X \rightarrow Y$,則我們說 $f$ 為對 $\mathcal{A}$的 可測函數 (measruable function) 如果下列條件成立:
若 對所有的 $B \in \mathcal{B}$,其 inverse image 落在$\mathcal{A}$中,亦即
\[
f^{-1}(B)=\{x \in X : f(x) \in B \} = \{ f \in B\} \in \mathcal{A}
\]其中 $\mathcal{B}$ 為 Borel $\sigma$-algebra (亦即 $\mathcal{B}$ 為 最小的 $\sigma$-algebra 且包含 $\mathbb{R}$ 中所有 open subsets )

Comments:
1. 關於甚麼是 Inverse image 請參閱此文: [數學] Image and Preimage

2. 如果考慮機率空間 $(\Omega, \mathcal{F}, P)$ (亦即 sampled space $\Omega$,$\sigma$-algebra $\mathcal{F}$,機率測度 $P$),關於機率測度有興趣的讀者請參考:[數學]機率公理淺談(Axioms of Probability)


============================
Random Variable as a Measurable Function
則我們可以定義隨機變數 (random variable ) $Z$。事實上 隨機變數 $Z$ 並不是隨機也不是變數,如前所述,本質上 $Z$ 為一個由sampled space $\Omega$ 映射到 實數 $\mathbb{R}$ 的 (可測)函數,亦即
隨機變數 $Z : \Omega \rightarrow \mathbb{R}$ 且滿足下列性質:對所有的 $z \in \mathbb{R}$
\[
\{\omega \in \Omega: Z(\omega) \leq z \} \in \mathcal{F}
\]
為什麼這樣定呢? 因為上述集合 $\{\omega \in \Omega: Z(\omega) \leq z \} \in \mathcal{F}$ ,也就是說是一個事件,既然是事件,我們便可以討論其對應的機率測度 $P(Z \leq z) =?$。

另外如果我們比對前述 可測函數的定義,可發現這樣的函數 $Z$ 為對 $\mathcal{F}$ 的 可測函數,亦即隨機變數為可測函數。

以下我們看一些例子:
Example 1:
設 $(\Omega, \mathcal{F}, P)$ 為一個機率空間,則我們定義函數 $Z: \Omega \rightarrow \mathbb{R}$ 為 $Z(\omega) =c, $ 則此函數 $Z$ 為一個隨機變數。
Proof
由隨機變數定義:給定  $z \in \mathbb{R}$,我們要證明
\[\{ \omega  \in \Omega :Z(\omega ) \le z\}  \in \mathcal{F}
\]現在觀察
\[\{ \omega  \in \Omega :Z(\omega ) \le z\}  = \{ \omega  \in \Omega :c \le z\}  = \left\{ \begin{array}{l}
\Omega ,\begin{array}{*{20}{c}}
{}&{}
\end{array}c \le z\\
\emptyset ,\begin{array}{*{20}{c}}
{}&{}
\end{array}c > z
\end{array} \right.
\]由 Sigma-algebra 定義可知 $\emptyset, \Omega  \in \mathcal{F}$。$\square$

Example 2:
設 $(\Omega, \mathcal{F}, P)$ 為一個機率空間,令 $A \in \mathcal{F}$ 為一事件。 則我們定義函數 $Z: \Omega \rightarrow \mathbb{R}$ 為
\[Z: = {I_A}\left( \omega  \right): = \left\{ \begin{array}{l}
1,\begin{array}{*{20}{c}}
{}&{}
\end{array}\omega  \in A\\
0,\begin{array}{*{20}{c}}
{}&{}
\end{array}\omega  \notin A
\end{array} \right.\]則此函數 $Z$ 為一個可測函數。
Proof
我們這邊利用可測函數的定義:給定  $B \in \mathcal{B}_{\mathbb{R}}$,我們要證明
\[\{ \omega  \in \Omega :Z(\omega ) \in B\}  \in \mathcal{F}
\]現在觀察 $\{ \omega  \in \Omega :Z(\omega ) \in B\}  = \{ \omega  \in \Omega :{I_A}\left( \omega  \right) \in B\}$ 故我們可以用以下幾個情況來判斷:
\[\begin{array}{l}
\text{if } 0 \in B,\;1 \notin B:\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \Rightarrow \{ \omega  \in \Omega :\omega  \notin A\}  = {A^c} \in {{\cal F}}\\
\text{if }1 \in B,\;0 \notin B:\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \Rightarrow \{ \omega  \in \Omega :\omega  \in A\}  = A \in {{\cal F}}\\
\text{if } 0,1 \in B:\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \Rightarrow \{ \omega  \in \Omega :\omega  \in \Omega \}  = \Omega  \in {{\cal F}}\\
\text{if }0,1 \notin B:\\
\begin{array}{*{20}{c}}
{}&{}&{}
\end{array} \Rightarrow \{ \omega  \in \Omega :\omega  \in \emptyset \}  = \emptyset  \in {{\cal F}} \ \ \ \ \square
\end{array}
\]

3. 如果我們考慮的是一組隨機變數,而不是單一個,比如說
 $\{Z_1, Z_2, ..., Z_n \}$ 為一組 collection of random variables。則我們需要考慮的是 smallest $\sigma$-algebra, 計作$\mathcal{G}$  使得
對任意一個隨機變數 $Z_i$ 都是對 $\mathcal{G}$ 可測,亦即

對所有的 $z \in \mathbb{R}$與 $i = 1,...,n$
\[
\{\omega \in \Omega: Z_i(\omega) \leq z \} \in \mathcal{G}
\] 我們稱此 sub-$\sigma$ algebra $\mathcal{G}$ 為 由 $\{Z_1, Z_2, ..., Z_n \}$所產生的 $\sigma$ algebra,計做 $\sigma\{Z_1, Z_2, ..., Z_n \}$

NOTE:注意到因為 $\mathcal{G} = \sigma\{Z_1, Z_2, ..., Z_n \}$ 為最小的$\sigma$-algebra,故其必定為原本 $\sigma$-algebra 的子集合,也就是說 $\mathcal{G} \subset \mathcal{F}$

留言

這個網誌中的熱門文章

[數學分析] 什麼是若且唯若 "if and only if"

數學上的 if and only if  ( 此文不討論邏輯學中的 if and only if,只討論數學上的 if and only if。) 中文翻譯叫做  若且唯若 (or 當且僅當) , 記得當初剛接觸這個詞彙的時候,我是完全不明白到底是甚麼意思,查了翻譯也是愛莫能助,畢竟有翻跟沒翻一樣,都是有看沒有懂。 在數學上如果看到 if and only if  這類的句子,其實是表示一種 雙條件句 ,通常可以直接將其視為" 定義(Definition)" 待之,今天要分享的是這樣的一個句子如何用比較直觀的方法去看他 假設我們現在有 兩個邏輯陳述句 A 與  B. 注意到,在此我們不必考慮這兩個陳述句到底是什麼,想表達什麼,或者到底是否為真(true),這些都不重要。只要知道是兩個陳述即可。 現在,考慮新的陳述:  "A if and only if B" 好了,現在主角登場,我們可以怎麼看待這個句子呢? 事實上我們可以很直覺的把這句子拆成兩部分看待,也就是 "( A if B ) and ( A only if B )" 那麼先針對第一個部分  A if B  來看, 其實這句就是說  if B then A, 更直白一點就是 "if B is true, then A is also true".  在數學上等價可以寫為 "B implies A" .  或者更常用一個箭頭符號來表示 "B $\Rightarrow$  A"  現在針對第二個部分  A only if B 此句意指  "If B is not true, then A is also not true". 所以如果已知 A is true,  那麼按照上句不難推得 B is also true 也就是說  A only if B  等價為 "If A is true then B is also true". 同樣,也可以寫作   "A implies B"   或者用箭頭表示  "A   $\Rightarrow$     B".

[數學分析] 淺談各種基本範數 (Norm)

這次要介紹的是數學上一個重要的概念: Norm: 一般翻譯成 範數 (在英語中 norm 有規範的意思,比如我們說normalization就是把某種東西/物品/事件 做 正規化,也就是加上規範使其正常化),不過個人認為其實翻譯成 範數 也是看不懂的...這邊建議把 Norm 想成長度就好 (事實上norm是長度的抽象推廣), 也許讀者會認為好端端的長度不用,為何又要發明一個 norm 來自討苦吃?? 既抽象又艱澀。 事實上想法是這樣的: 比如說現在想要比較兩個數字 $3$ , $5$ 之間的大小,則我們可以馬上知道 $ 3 < 5 $;同樣的,如果再考慮小數與無理數如 $1.8753$ 與 $\pi$,我們仍然可以比較大小 $1.8753 < \pi = 3.1415...$ 故可以發現我們有辦法對 "純量" 做明確的比大小,WHY? 因為前述例子中 $3$, $5$, $1.8753$ or $\pi$ 其各自的大小有辦法被 "measure "! 但是如果是現在考慮的是一組數字 我們如何去measure 其大小呢?? 比如說 \[x:=[1, -2, 0.1, 0 ]^T \]上式的大小該是多少? 是 $1$? $-2$? $0.1$??? 再者如果更過分一點,我們考慮一個矩陣 \[A = \left[ {\begin{array}{*{20}{c}} 1&2\\ 3&4 \end{array}} \right] \],想要知道這個矩陣的大小又該怎麼辦?? 是 $1$ ? $2$ 還是 $4$ ?..其實現階段我們說不清楚。 也正是如此,可以發現我們確實需要新的 "長度" 的定義來幫助我們如何去 measure 矩陣/向量/甚至是函數的大小。 故此,我們首先定義甚麼是Norm,(也就是把 "長度" or "大小" 的本質抽離出來) ================== Definition: Norm 考慮 $V$ 為一個向量空間(Vector space),則我們說  Norm 為一個函數 $||\cdot|| : V \rightarrow \mathbb{R}$ 且滿足下列性質