本篇文章使用淺顯易懂集合論的語言,連接統計學現實與抽象化的過程,來重新詮釋統計學的概念,並區分一些差異與澄清一些觀念,希望能對初學統計的讀者有些幫助。 [定義有限母體] 日常生活中,母體的概念大家都能理解,很多很多個體。我們可以定義一個很大但有限的集合$\Omega$ ,每個獨一無二的個體記做 $s$ ,所以可以寫成 $s \in \Omega$ 而全部個數記做 $N$ (現實生活中$N$很大通常未知,除非我們有能力有時間消耗大量成本做普查才能得知 $N$) $$ |\Omega| = N $$ [ex:] 例如全台灣人,兩千三百萬人左右,則可以寫成 $N \approx 2300 \times 10^4$ 而我們感興趣的可能是個體的可以量化的屬性(如:身高,成績),所以可以定義一個實數函數(real-valued function) $$ X : \Omega \longrightarrow \mathbb{R} $$ [ex:] 例如阿元的月收入$\$$ 可以寫成 $X(阿元) = 22 \times 10^3$ 或是記做下標 $X_{阿元} = 22 \times 10^3$ ,而每個人的月收入有高有低,如果把那些"值"聯集起來,我們能說一定若在實數域裡面 !! [屬性值有哪些] 數學上來說就是 range of $X$ , image of $X$ $$ X(\Omega) := \{ X_s \in \mathbb{R}: s\in \Omega \} = \bigcup_{s\in \Omega} \{ X_s\} \subset \mathbb{R} $$ 這時我們可以把薪水的值記做 $x \in X(\Omega)$ [計數與比例] 這時大家會好奇說有沒有其他人跟我一樣的薪水,還有那群人在全台灣人佔了多少比例,所以會計算個數 (Count) ,以及比例 (Frequency) 。 正是數學定義如下: $$ \text{Count}(x,\Omega) := |\{ s\in \Omega : X_s = x \}| \in [0,|\Omega|]_\mathbb{Z} $$ $$\text{Frequency}(x,\Omega) :=