第二十四章 數據特征在測度
一、集中趨勢的測度
集中趨勢是指一組數據向某一中心值靠攏的傾向,測度集中趨勢也就是尋找數據一般水平的代表值或中心值。集中趨勢的測度,主要包括位置平均數和數值平均數。位置平均數是指按數據的大小順序或出現頻數的多少,確定的集中趨勢的代表值,主要有眾數、中位數等;數值平均數是指根據全部數據計算出來的平均數,主要有算術平均數、幾何平均數等。
(一)眾數
眾數是一組數據中出現頻數最多的那個數值,用M0表示。例如,一家連鎖超市的10個分店某月的銷售額(單位:萬元)分別為:
61 65 73 78 80 80 80 80 96 97
這l0個分店月銷售額的眾數為M0=80(萬元)
用眾數反映集中趨勢,非常直觀,不僅適用手品質數據,也適用于數值型數據。眾數是一個位置代表值,不受極端值的影響,抗干擾性強。所謂極端值就是明顯比其他數據大得多或小得多的數值。
(二)中位數
把一組數據按從小到大的順序進行排列,位置居中的數值叫做中位數,用Me表示。中位數將數據分成兩部分,其中一半的數據小于中位數,另一半數據大于中位數。這里只簡單介紹一下根據未分組數據計算中位數的方法。
根據未分組數據計算中位數時,要先對數據進行排序,然后確定中位數的位置,其公式為:
中位數位置= (n+1)/2
式中,n為數據的個數。最后確定中位數的具體數值。
設一組數據為X1,X2,…,Xn,按從小到大順序為X(1),X(2),…,X(n),則中位數為:
例如,某地級市下轄9個縣,每個縣的面積如下(單位:平方千米),計算該市下轄縣面積的中位數:
1455 2019 912 1016 1352 1031 2128 1075 2000
首先,將上面的數據排序結果如下:
912 1016 1031 1075 1352 1455 2000 2019 2128
中位數位置=(9+1)÷2=5,中位數為1352,即Me =1352(平方千米)
在上例中,由于行政區劃調整,臨市的一個面積為1000平方千米的縣劃歸該市。行政區劃調整后,該市現在下轄10個縣,該市下轄縣的面積(單位:平方千米)從小到大依次為:
912 1000 1016 1031 1075 1352 1455 2000 2019 2128
計算行政區劃調整后該市下轄縣面積的中位數:
中位數位置=(10+1) ÷2=5.5,中位數為1213.5,即
Me= (1075+1352)÷2=1213.5(平方千米)
中位數主要用于順序數據,也適用于數值型數據,但不適用于分類數據。中位數也是一個位置代表值,不受極端值的影響,抗干擾性強。
(三)算術平均數
算術平均數是全部數據的算術平均,又稱均值,用 表示。算術平均數是集中趨勢最主要的測度值,在統計學中具有重要的地位,是進行統計分析和統計推斷的基礎。它主要適用于數值型數據,但不適用于品質數據。根據數據表述形式的不同,算術平均數有不同的計算形式和計算公式。
1.簡單算術平均數。簡單算術平均數主要用于處理未分組的原始數據。設一組數據為X1,X2,…,Xn,簡單算術平均數的計算公式為:
例如,某售貨小組有5名營業員,元旦一天的銷售額分別為520元、600元、480元、750元和500元,求該日平均銷售額。
計算結果表明,元旦5名營業員的平均銷售額為570元。
2.加權算術平均數。加權算術平均數主要用于處理經分組整理的數據。設原始數據被分成k組,各組的組中值為X1,X2,…,Xn,各組的頻數分別為f1,f2,…,fk,加權算術平均數的計算公式為:
例如,某市商業企業協會根據100個會員樣本,整理出一年銷售額分布資料:
計算年平均銷售額。
首先確定組中值,計算結果在表24—1中列出。代入公式得:
計算結果表明,100個商業企業的年均銷售額為240萬元。
計算和運用算術平均數需注意:第一,算術平均數同時受到兩個因素的影響,一個是各組數值的大小,另一個是各組分布頻數的多少。在數值不變的情況下,哪一組的頻數多,該組的數值對平均數的作用就大,反之哪一組的頻數少,該組數值對平均數的影響就小。頻數在加權算術平均數中起著權衡輕重的作用,這也是加權算術平均數“加權”一詞的來歷。第二,算術平均數易受極端值的影響。比如有下列資料:5、7、5、4、6、7、8、5、4、7、8、6、20,全部資料的平均數是7.1,實際上大部分數據(有10個)不超過7,如果去掉20,則剩下12個數的平均數為6。由此可見,極端值的出現,會使平均數的真實性受到干擾。
(四)幾何平均數
n個觀察值連乘積的n次方根就是幾何平均數。根據資料的條件不同,幾何平均數也有加權和不加權之分。這里只介紹簡單幾何平均數的計算。
設一組數據為X1,X2,…,Xn,且大于0, g表示幾何平均數,則:
式中,Ⅱ為連乘積符號。
例如,某型號鉆頭的生產,需經過6道不同的加工工序,各道工序的合格率如表24—2所示,計算平均合格率。
用幾何平均數的方法進行計算,得:
各道工序的平均合格率為96.63%。
計算幾何平均數要求各觀察值之間存在連乘積關系,它的主要用途是:①對比率、指數等進行平均;②計算平均發展速度。
相關文章:
(責任編輯:中大編輯)