差異量數即資料的離中趨勢,指資料分佈中資料彼此分散的程度。差異量數越大,表示時距分佈的範圍越廣;差異量數越小,表示資料分佈得越集中,變動範圍越小。差異量數是用於描述資料離散程度的統計量,有全距、四分位差、平均差、方差和標準差。相對離散程度可以用變異係數度量。
一、絕對的差異量數★★★
(一)全距
1.含義:又稱為兩極差,用符號R表示。把一組資料中最大值減去最小值之差。
2.計算:R=Xmax-Xmin
3.特點:計算簡單、易理解,但不穩定、不可靠、不靈敏、易受抽樣變動影響。
(二)離差和平均差
1.離差
離差是某一資料與平均數的差,表示每一個觀測值與平均數距離的大小。任何一組資料的離差和均為0。
2.平均差
平均差是指原始資料與平均數絕對離差的平均值。
(三)方差與標準差
1.含義
也稱變異數、均方。離均差平方和的平均數,是每個資料與該組資料平均數之差乘方後的均值。樣本方差用符號S2(S方)、總體方差用符號σ2(σ方)表示。
標準差:方差的平均根。樣本方差用S或SD表示;總體方差用σ表示。
2.計算
(1)總體方差與標準差公式
(2)樣本方差與標準差公式
(3)自由度:一組資料中可以自由取值的資料的個數。
當樣本資料的個數為n時,若樣本均值M確定後,只有n- 1個資料可以自由取值,其中必有一個資料則不能自由取值。
(4)方差與標準差原始資料計算公式
(5)總標準差的合成
方差具有可加性的特點。當已知幾個小組資料的方差或標準差時,可以計算幾個小組聯合在一起的總的方差或標準差。
式中,S,為總標準差: S為各小組標準差; N為各小組資料個數; d1=X:-X (X;為總平均數,x為各小組的平均數)。
3.性質及意義
(1)方差的性質
方差是對一組資料中各種變異的總和的測量,具有可加性和可分解性。
(2)標準差的性質
如果每個觀測值都增加一個常數C,所得的標準差不變;
如果每個觀測值都乘以一個常數C (C≠0), 所得的標準差擴大C倍;
如果每個觀測值都乘以一個常數C (C≠0),再加上一個常數d,所得的標準差擴大C倍。
(3)意義
方差與標準差是表示一組資料離散程度的最好指標。其值越大,次數分佈越分散,反之,其值越小,離散越小。
優點:反應靈敏、計算嚴謹、計算容易、適合代數運算、受抽樣變動影響小、意義簡單明瞭。
缺點:易受極端數值和模糊資料的影響。
標準差具備一個良好的差異量數應具備的條件。標準差與其他各種差異量數相比,具有數學上的優越性,特別是當已知一組資料的平均數與標準差後,就可以知道落在平均數上下各一個標準差、兩個標準差或三個標準差範圍內的資料所佔的百分比。
二、相對的差異量數★★★★
(一)差異係數
1.含義:差異係數又稱變異係數、相對標準差等,它是一種相對量數,用CV表示,是標準差對平均數的百分比。其計算如下:
CV=S÷X拔
式中,s為某樣本的標準差; X拔為該樣本的平均數。
2.差異係數在心理與教育研究中常用於:
(1)兩個或兩個以上樣本所使用的觀測工具不同,所測的特質也不同:
(2)兩個或兩個以上樣本使用的是同種觀測工具,所測的特質相同,但樣本間水平差異較大。
3.在應用差異係數比較相對差異大小時,一般應注意:
(1)測量資料必須等距;
(2)測量工具具備絕對零;
(3)差異係數只能用於一般的相對差異量的描述,由於尚無有效的檢驗方法,目前不能進行推理統計。
(二)標準分數
1.定義
標準分數又稱為基分數或Z分數,是以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數,也叫Z分數,用於對變數的標準化處理。
標準分數是對某一個值在一 組資料中相對位置的度量:以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數。標準分數從分數對平均數的相對地位、該組分數的離中趨勢兩個方面來表示原始分數的地位。
2.性質
(1) Z分數無實際單位,是以平均數為參照點,以標準差為單位的一個相對量。
(2)所有原始分數的Z分數之和為0,Z分數的平均數也為0。一組原始分數轉 換得到的Z分數可以是正值,也可以是負值。
(3)原始資料的Z分數的標準差為1。
(4)若原始分數呈正態分佈,則轉換得到的所有Z分數均值為0,標準差為1的標準正態分佈。
⑤原始分數轉換成Z分數後,兩者分佈形態相同。
3.優缺點
(1)優點
①可加性:不同性質的原始資料具有相同的參照點,因此可相加;
②可比性:不同性質的成績,一經轉換為標準分數,就可在同一背景下比較;
③明確性:知道了標準分數,利用分佈函式表就能知道起其百分等級;
④穩定性:轉換成標準分數之後,規定了標準差為1,保證了不同性質分數在總分數中權重一樣。
(2)缺點
①計算複雜,概念抽象,不易理解:
②Z分數有負值和零值,有時還會有小數;
③進行比較時需要滿足原始資料的分佈形態相同這一條件。
4.應用
(1)比較幾個不同屬性性質不同的觀測值在各自資料分佈中相對位置的高低;
(2)計算不同質的觀測值的總和或平均值,以表示在團體中的相對位置;
(3)異常值的取捨:通常在一個正態分佈中,若一個資料的取值落在+3σ之外,則在整理資料時可將此資料作為異常值捨棄。
(4)若標準分組中有小數。負數等不易被人接受的問題,可透過z' =aZ+b的線性公式將其轉換成新的分數。
①分數的轉換有兩種:
一種是正態化轉換,即根據原始分數計算出百分等級,再查正態分佈表得到每個資料的P值,由此將整個分佈轉換為正態分佈,這是一種非線性轉換。
另一種是由Z分數經公式直接轉換為T分數,這就是線性轉換,若不經正態化,其分數分佈仍與原始分數的分佈形態一致。一組非正態資料若要轉換為正態化標準分數,則同時需要以上兩步轉換過程。
②幾種常見的匯出分數:
正態化標準分數: T=10Z+50
韋氏成人智力量表: IQ=15Z+100
比奈-西蒙量表: Z ' =16Z+100
(三)百分位數與百分等級
1.百分位數
百分位數是處於某一百分比的人對應的分數。在此分數以下,包括資料分佈中全部資料個數的一定百分比。第P個百分位數就是指在其值P的資料以下,包括分佈中全 部資料的百分之p。例如,第50位百分位數P5o等於89 分,那麼在89分以下就包括50%的資料。計算方式如下:
式中,Pp為所求的第P個百分位數: Lnp表示百分位數所在組的精確下限; f為百分 位數所在組的次數; Fr表示小於L的各組次數的和; N為總次數; i為 組距。
2.百分等級
利用百分位數的計算公式也可以計算出任意分數在整個分數分佈中所處的百分位置,稱為該分數的百分等級,符號為PR。百分等級是一種相對位置量數,它是百分位數的逆運算。例如,某人考試成績的百分等級Pp為80,就意味著他的成績比79%的人要好,但比20%的人要差。
百分等級的計算公式是:
式中,PR為所求的百分等級; X為給定的原始分數; f為該分數所在組的頻數; Lb 表示該分數所在組的精確下限; F.表示小於Lp的各組次數的和; N為總次數; i為組距。若資料未分組:
式中,R為某人在測驗中的排序。
(四)百分位差和四分位差
1.百分位差:是指某一百分位數與另一百分位數之間的差值。常用的百分位差: P90- P10和P93-P7。
2.特點:容易理解、易計算,且較少受兩極數值的影響;但不能反映出分佈的中間數值的差異情況、穩定性較差(沒有考慮全部資料)。
2.四分位差
也可視為百分位差的一種,通常用符號Q來表示,指在一個次數分配中,中間50%的次數的距離的一半。在一組資料中,它的值等於P25到P75距離的二分之一。這個差異量數能夠反映出資料分佈中間50%資料的散佈情況。
四分位差的計算,基於兩個百分位數,即P25和P75。 這兩個點值與中數一起把整個資料的次數等分為四部分,因此稱它們為四分值,或四分位數。由於P25之下佔有總次數的四分之一,故P25又稱為第一四分位(Q1) ,中數或P50稱為第二四分位(Q2), P75稱為第三四分位(Q3) 。四分位差就是第三四分位與第一四分位之差的一半。它的計算公式如下: