第二節 使用合適的量度方法比較不同組別數據的離差
使用合適的量度方法比較不同組別數據的離差

在之前的課堂中,我們學習了三種不同的離差量度,它們分別是

  • 分佈域
  • 四分位數間距
  • 標準差
這幾種方法各有優點和缺點,因此我們需要在不同情況下選擇適當的量度。下表綜合了它們的一些優點和缺點:
離差量度 優點 缺點
分佈域
  • 容易計算
  • 能表示數據組中的最大值和最小值之差距
  • 計算時只涉及兩個數據,因此可能無法準確反映數據組的離差
  • 計算時只考慮數據組中的最大值和最小值,因此非常容易受極端數據影響
四分位數間距
  • 只考慮數據組中間\(\;50\%\;\)的數據,因此不易受極端數據影響
  • 計算時只涉及部分數據,因此有時候無法準確反映數據組的離差
標準差
  • 計算時考慮全部數據,因此能更準確反映數據組的離差
  • 計算方法比較繁複,大多需用計算機或電腦計算
  • 會受極端數據影響
分佈域、四分位數間距和標準差的比較

注意 離差的量度方法不只這三種,有時我們應選用其他方法。例如,在體操比賽中,要量度一位運動員的穩定性,通常會把每輪比賽中最好和最差的評分剔除,再計算餘下數據的標準差。這樣做能減少極端數據對標準差的影響,又比四分位數間距更準確。

練習 - 使用合適的量度方法比較不同組別數據的離差

請在以下的例子中,選出最適合的離差量度。

  1. 天文台描述某天內的天氣變化:

    分佈域

    四分位數間距

    標準差

  2. 香港人每月入息的差距:

    分佈域

    四分位數間距

    標準差

  3. 一班同學的數學測驗成績之差異:

    分佈域

    四分位數間距

    標準差

  4. 某牌子的罐裝汽水每罐容量之差異:

    分佈域

    四分位數間距

    標準差

  5. 某社交應用程式用戶的聯絡人數目之差異:

    分佈域

    四分位數間距

    標準差

上一節
返回