現實生活中,很很多資料,不管是文字跟數字,代表的意義也不同,但在實作運算上需要特別注意,本文先介紹一些常見的類型,值域型態 :
1.名目尺度(Nominal) :
任意兩元素只能區分相同與不相同
任意兩元素只能區分相同與不相同
例如 :
[1] $X_i = \{ \text{apple} , \text{bananas} \}$
[2] $X_i = \{ \text{mac} , \text{windows} , \text{linux} \}$
[3] $X_i = \{True = 1 , False = 0 \}$
注意: 模糊理論(Fuzzy Theory) 有對於 Boolean 集合論隸屬關係 $\in$ {0,1} 拓展到 [0,1] ,定義模糊的概念
注意: 資工方面,常常會把文字"string"資料轉數字"int" ,如: Hash function
2.順序尺度(Ordinal) :
任意兩元素可以區分不同,也可以有大小排序,但不能運算出其差距
例如 : 排名,偏好 $X_i = \{ 1 = 1st , 2 = 2nd , 3 = 3rd , 4 = 4th \}$
3.等距尺度(Interval):
任意兩元素可以區分不同,也可以有大小排序,也可以計算其差距,但是沒有參考原點(理想點),不能做乘除運算,不能探討倍數關係
例如: 攝氏溫標 85度C 的 2倍 $\neq$ 170度C
例如: 絕對時刻 碼表上的 3秒 兩倍未必是 6秒 (除非你從 0 秒開始算)
任意兩元素可以區分不同,也可以有大小排序,也可以計算其差距,但是沒有參考原點(理想點),不能做乘除運算,不能探討倍數關係
例如: 攝氏溫標 85度C 的 2倍 $\neq$ 170度C
例如: 絕對時刻 碼表上的 3秒 兩倍未必是 6秒 (除非你從 0 秒開始算)
4.等比尺度(Ratio)
任意兩元素可以區分不同,也可以有大小排序,也可以計算其差距,可以做乘除運算
有參考原點 "0" 與單位長 "1 - 0"的概念,可以利用參考原點計算出變化 $\Delta$
例如: 計量 $X_i = \{ 1=1個,2=2個,3=3個,.... \}$
任意兩元素可以區分不同,也可以有大小排序,也可以計算其差距,可以做乘除運算
有參考原點 "0" 與單位長 "1 - 0"的概念,可以利用參考原點計算出變化 $\Delta$
例如: 計量 $X_i = \{ 1=1個,2=2個,3=3個,.... \}$
數學上常見可以分成(尤其在定義機率論值域的時候0)
1. Discrete(離散型)
2. Continuous(連續型)
[1] 雙閉區間(closed interval)
例如: $[2,10]$ , $[0,M]$
例如: $[2,10]$ , $[0,M]$
[2] 雙開區間(open interval)
例如: $(3,8)$,$(-\infty,\infty) = \mathbb{R}$
注意 : 程式實作上通常是雙閉(由於閉區間在數學上性質比較好,Extreme value theorem),像 $(3,8)$ 可能寫成 $[3\pm \epsilon_1,8\pm \epsilon_2] $,$(-\infty,\infty)$ 寫成 $[-M,M]$
例如: $(3,8)$,$(-\infty,\infty) = \mathbb{R}$
注意 : 程式實作上通常是雙閉(由於閉區間在數學上性質比較好,Extreme value theorem),像 $(3,8)$ 可能寫成 $[3\pm \epsilon_1,8\pm \epsilon_2] $,$(-\infty,\infty)$ 寫成 $[-M,M]$
[3] 一半一開(half-open , half-closed)
例如: (0,100] , [0,100) , [0,$\infty$) 時間軸
例如: (0,100] , [0,100) , [0,$\infty$) 時間軸
[4] finite union (有限個聯集)
例如: $[1,3] \cup (4,5] \cup (6,7) \cup \{4\}$
[5] countable union (可數無限個聯集)
例如: $[1,3] \cup (4,5] \cup (6,7) \cup \{4\}$
[5] countable union (可數無限個聯集)
例如: $\bigcup_{n\in \mathbb{N} }[n,n+1)$
[以上純為學術經驗交流知識分享,如有錯誤或建議可留言~~]
by Plus & Minus 2017.08
留言
張貼留言