本文介紹筆者自己定義的名詞 : Merge Encoding ,或許有別的學術名詞 !! 數學概念簡單易懂,用途方便理解集合論,機率論,壓縮紀錄大量的元素等等 :)
在數學上,我們習慣會用 \{0,1\} = \{ False , True \},而且日常生活經驗常構造出高維度子集合
s \in S \subseteq \{0,1\}^{n}
====================================================
例如 : n = 3 長相大概像這樣 s \equiv (s_1,s_2,s_3) \in S = \{(0,0,1), (1,0,1),.....\} \subseteq \{0,1\}^3
====================================================
很明顯 |S| \leq 2^{n},而且 \bigwedge_{s \in S}\bigg(\sum_{k=1}^{n} s_k \in [0,n]_{\mathbb{Z}} \bigg)
可以把 n 想成物件的集合個數 |K| ,K 為物件集,則 S 相當於選取哪些物件可能的組合,類似背包問題(knapsack problem)的概念。
=====================================================
例如: (0,1,1) 代表選第2個與第3個物件
=====================================================
今想要表達一個物件 k \in K 在集合S是可有可無的概念,也就是 (s_{k},s_{-k}) , (\bar{s_k},s_{-k}) \in S
其中
\bar{s_k} = \left\{ \begin{array}{ccc} 1 & \text{if } & s_k = 0 \\ 0 & \text{if } & s_k =1 \\ \end{array} \right. \quad , \quad s_{-k} \equiv \underbrace{(s_{k'})_{k' \in K-\{k\}}}_{\text{向量}}
於是可以使用新的數字 2 來表達此概念 :) 2 \equiv \{0,1\}
定義 MergeEncoding , (s_{k},s_{-k}) \text{ or } (\bar{s_{k}},s_{-k}) \equiv (2,s_{-k})
====================================================
例如 : S = \{ (0,1,\color{red}{1}), (0,1,\color{red}{0})\} \equiv \{ (0,1,\color{red}{\{0,1\}})\} \equiv \{ (0,1,{\color{red}2}) \}
====================================================
所以任何 S \subseteq \{0,1\}^{|K|} ,都存在 S' \subset \{0,1,2 \}^{|K|}
注意: Merge Encoding 不是函數,S' \in MergeEncoding(S),但是 preimage 是一個函數 !! InverseMergeEncoding(S') = S
白話來說 : 給一個 S 可能有很多種 S' 的表示,給一個 S' 只會有唯一的 S !!
====================================================
例子[*]:
S = \{ (1,0,0) , (1,1,0) , (0,1,1) , (1,1,1) \} \equiv \underbrace{\{ (1,0,0) , (1,1,2) , (0,1,1) \}}_{S'_1} \equiv \underbrace{\{ (1,2,0) ,(2,1,1) \}}_{S'_2}
====================================================
有了 Merge Encoding 以後,就可以拿來跟代數意義,集合論/機率論結合
[*] 代數意義: 英文大寫 = 1 ,英文小寫 = 0
Abc + ABc + aBC + ABC = Abc + AB(C+c) +aBC = A(B+b)c + (A+a) BC
就是分配律啦 ~~ ,項數越少,計算量就越少,如何給定 S 快速找到元素最少的 Merge Encoding S^{*} := \underset{S' \in MergeEncoding(S)}{\text{argmin } |S'| } 是重要的問題 !!
集合論 :
給定一些集合 \Omega_k,定義 \bigwedge_{k \in K} \bigg( s_k = 1 \Longleftrightarrow \omega \in \Omega_k \bigg)
於是 \Omega_{k} \equiv (\overbrace{1}^{s_k},\overbrace{2,...,2}^{s_{-k}})
==========================================================
例如 : |K| = 2
\Omega_{1} \cap \Omega_{2} \equiv (1,1)
\Omega_1 \setminus \Omega_2 \equiv \Omega_{1} \cap \bar{\Omega_{2}} \equiv (1,0)
\Omega_2 \setminus \Omega_1 \equiv \bar{\Omega_{1}} \cap \Omega_{2} \equiv (0,1)
\Omega_{1} \equiv (1,2)
\Omega_{2} \equiv (2,1)
\Omega_{1} \cup \Omega_{2} \equiv \{(1,1),(1,0),(0,1) \}
全空間 \equiv \{ (2,2)\}
==========================================================
機率論:
P(\Omega_{1} \cap \Omega_{2}) \equiv p_{11}
P(\Omega_1 \setminus \Omega_2) \equiv P(\Omega_{1} \cap \bar{\Omega_{2}}) = p_{10}
P(\Omega_2 \setminus \Omega_1) \equiv P(\bar{\Omega_{1}} \cap \Omega_{2}) = p_{01}
P(\Omega_{1}) = p_{12} = p_{10} + p_{11}
P(\Omega_{2}) = p_{21} = p_{01} + p_{11}
P(\Omega_{1} \cup \Omega_{2}) = p_{10} + p_{11} + p_{01} = p_{12} + p_{01} = p_{21} + p_{10} = p_{22} - p_{00}
P(全空間) = p_{22} =1
[檢驗 S' \equiv S]
有個必要條件
也就是把 2 全部展開後的元素個數要跟 |S| 相等
S' \in MergeEncoding(S) \Longrightarrow \sum_{s' \in S'} 2^{\#} = |S|
其中 : \# := \sum_{k \in K}\color{blue}{\underbrace{[s'_k = 2]}_{\text{Iverson Bracket}}} = 2\text{的個數}
例如: 例子[*] 分別為 1+1+1+1 = 1+2+1 = 2+2 = 4
[小記]
由於筆者對於數字 2 \equiv \{0,1\} 比較敏感,有了 Merge Encoding,就更能理解|K|維度文氏圖,排容原理(inclusion-exclusion principle)的計算,而非透過集合符號 !! 記得口訣 : 看到 2 就可以展開 0 跟 1 !!
在數學上,我們習慣會用 \{0,1\} = \{ False , True \},而且日常生活經驗常構造出高維度子集合
s \in S \subseteq \{0,1\}^{n}
====================================================
例如 : n = 3 長相大概像這樣 s \equiv (s_1,s_2,s_3) \in S = \{(0,0,1), (1,0,1),.....\} \subseteq \{0,1\}^3
====================================================
很明顯 |S| \leq 2^{n},而且 \bigwedge_{s \in S}\bigg(\sum_{k=1}^{n} s_k \in [0,n]_{\mathbb{Z}} \bigg)
可以把 n 想成物件的集合個數 |K| ,K 為物件集,則 S 相當於選取哪些物件可能的組合,類似背包問題(knapsack problem)的概念。
=====================================================
例如: (0,1,1) 代表選第2個與第3個物件
=====================================================
今想要表達一個物件 k \in K 在集合S是可有可無的概念,也就是 (s_{k},s_{-k}) , (\bar{s_k},s_{-k}) \in S
其中
\bar{s_k} = \left\{ \begin{array}{ccc} 1 & \text{if } & s_k = 0 \\ 0 & \text{if } & s_k =1 \\ \end{array} \right. \quad , \quad s_{-k} \equiv \underbrace{(s_{k'})_{k' \in K-\{k\}}}_{\text{向量}}
於是可以使用新的數字 2 來表達此概念 :) 2 \equiv \{0,1\}
定義 MergeEncoding , (s_{k},s_{-k}) \text{ or } (\bar{s_{k}},s_{-k}) \equiv (2,s_{-k})
====================================================
例如 : S = \{ (0,1,\color{red}{1}), (0,1,\color{red}{0})\} \equiv \{ (0,1,\color{red}{\{0,1\}})\} \equiv \{ (0,1,{\color{red}2}) \}
====================================================
所以任何 S \subseteq \{0,1\}^{|K|} ,都存在 S' \subset \{0,1,2 \}^{|K|}
注意: Merge Encoding 不是函數,S' \in MergeEncoding(S),但是 preimage 是一個函數 !! InverseMergeEncoding(S') = S
白話來說 : 給一個 S 可能有很多種 S' 的表示,給一個 S' 只會有唯一的 S !!
====================================================
例子[*]:
S = \{ (1,0,0) , (1,1,0) , (0,1,1) , (1,1,1) \} \equiv \underbrace{\{ (1,0,0) , (1,1,2) , (0,1,1) \}}_{S'_1} \equiv \underbrace{\{ (1,2,0) ,(2,1,1) \}}_{S'_2}
====================================================
有了 Merge Encoding 以後,就可以拿來跟代數意義,集合論/機率論結合
[*] 代數意義: 英文大寫 = 1 ,英文小寫 = 0
Abc + ABc + aBC + ABC = Abc + AB(C+c) +aBC = A(B+b)c + (A+a) BC
就是分配律啦 ~~ ,項數越少,計算量就越少,如何給定 S 快速找到元素最少的 Merge Encoding S^{*} := \underset{S' \in MergeEncoding(S)}{\text{argmin } |S'| } 是重要的問題 !!
集合論 :
給定一些集合 \Omega_k,定義 \bigwedge_{k \in K} \bigg( s_k = 1 \Longleftrightarrow \omega \in \Omega_k \bigg)
於是 \Omega_{k} \equiv (\overbrace{1}^{s_k},\overbrace{2,...,2}^{s_{-k}})
==========================================================
例如 : |K| = 2
\Omega_{1} \cap \Omega_{2} \equiv (1,1)
\Omega_1 \setminus \Omega_2 \equiv \Omega_{1} \cap \bar{\Omega_{2}} \equiv (1,0)
\Omega_2 \setminus \Omega_1 \equiv \bar{\Omega_{1}} \cap \Omega_{2} \equiv (0,1)
\Omega_{1} \equiv (1,2)
\Omega_{2} \equiv (2,1)
\Omega_{1} \cup \Omega_{2} \equiv \{(1,1),(1,0),(0,1) \}
全空間 \equiv \{ (2,2)\}
==========================================================
機率論:
P(\Omega_{1} \cap \Omega_{2}) \equiv p_{11}
P(\Omega_1 \setminus \Omega_2) \equiv P(\Omega_{1} \cap \bar{\Omega_{2}}) = p_{10}
P(\Omega_2 \setminus \Omega_1) \equiv P(\bar{\Omega_{1}} \cap \Omega_{2}) = p_{01}
P(\Omega_{1}) = p_{12} = p_{10} + p_{11}
P(\Omega_{2}) = p_{21} = p_{01} + p_{11}
P(\Omega_{1} \cup \Omega_{2}) = p_{10} + p_{11} + p_{01} = p_{12} + p_{01} = p_{21} + p_{10} = p_{22} - p_{00}
P(全空間) = p_{22} =1
[檢驗 S' \equiv S]
有個必要條件
也就是把 2 全部展開後的元素個數要跟 |S| 相等
S' \in MergeEncoding(S) \Longrightarrow \sum_{s' \in S'} 2^{\#} = |S|
其中 : \# := \sum_{k \in K}\color{blue}{\underbrace{[s'_k = 2]}_{\text{Iverson Bracket}}} = 2\text{的個數}
例如: 例子[*] 分別為 1+1+1+1 = 1+2+1 = 2+2 = 4
[小記]
由於筆者對於數字 2 \equiv \{0,1\} 比較敏感,有了 Merge Encoding,就更能理解|K|維度文氏圖,排容原理(inclusion-exclusion principle)的計算,而非透過集合符號 !! 記得口訣 : 看到 2 就可以展開 0 跟 1 !!
[以上純為學術經驗交流知識分享,如有錯誤或建議可留言~~]
by Plus & Minus 2018.07
留言
張貼留言