1.種類
①屬性分配數列:
按品質標志分配而形成的數列叫屬性分配數列,簡稱品質數列,如上例內蒙古自治區人口分布。
②變量分配數列
按數量標志分組而形成的數列叫變量分配數列,簡稱變量數列。
1)單項式變量分組數列
是按每個變量值分別列組而形成的數列。
2)組距式變量數列
把各變量值按照一定組距進行分組而形成的數列。如:上例某班學生統計考試成績表。
在組距數列中,表示各組界限的變量值稱為組限,50—60,60—70等。其中較小的變量值稱為下限,50,60等,較大的變量值為上限,60,70等,各組上限與下限之差即為組距,組距=上限-下限,60-50,70-60等,各組上限與下限的中點稱為組中值,即組中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,組中值具有一定的假定性,即假定次數在各組內的分布是均勻的,代表了各組內的一般水平。
a.等距分組
各組的組距均相等。
特點:由于各組組距相等,各組次數的分布不受組距大小的影響,它和消除了組距影響,與次數密度的分布是一致的,一般呈正態分布。
次數密度=次數/組距,其作用主要用于消除各組組距不相等而造成的現象分布的影響。
b.不等距分組
各組組距不相等。
特點:不等距分組各組的次數多少受組距不同的影響,組距大次數可能多,組距小,則次數可能少,
因此必須消除組距對其分布的影響即需計算次數密度。
在編制組距式變量數列時,常常會遇到這樣的情況,如:學生成績的分布
60分以下
60—70
70—80等
又如:學生人數的分布
30人以下
30—60
60人以上等
這種具有不確定組距的組稱為“開口組”,包括上開口和下開口,其組中值如何計算?
下開口的組中值=上限-1/2鄰組組距
上開口的組中值=下限+下限1/2鄰組組距
2.變量數列的編制
程序:①原始數據②序列化(編制由小到大簡單數列)③求出組距等④分組歸類合計(形成次數分布)⑤制成統計表(變量數列)
a.離散型變量
由于離散型變量各變量值之間以整數斷開,變量值之間有明顯的界限,上下限都可以用準確的數值表示,組限非常清楚。
如:某校按學生人數分組,其組限為:
100人以下
101—200
201—300
301—400
401人以上
b.連續型變量
由于連續型變量各變量值之間可做無限分割,有小數存在,上下限不能用兩個確定的值表示,只能用前一組的上限與本組的下限為同一數值表示。如:上例考試成績
統計實際工作中,雖然變量區分連續型變量與離散型變量,但為了計算,繪圖等的方便,保證整體單位不出現重復、遺漏。可采用連續型變量的形式代替離散型變量。
對于連續型變量,在確定組限時,有一原則可循,即“上組限不在內”原則:各組只包括本組下限變量值的單位,不包括本組上限變量值的單位。
3.編制統計表
如上例40人考試成績分為5組,組距為10,組限可以為:
50—60,60—70,…,90—100
可以使考試成績的優、良、中、及、不及格的特征體現出來。
編輯推薦:
關注:2014統計師考試動態 2014核心備考方案 考試用書
(責任編輯:hbz)
近期直播
免費章節課
課程推薦
統計師
[協議護航-退費班]
12大模塊 準題庫資料 協議退費校方服務
統計師
[協議護航-暢學班]
12大模塊 準題庫資料 協議續學校方支持
統計師
[豐羽計劃-暢學班]
4大模塊 題庫練習 精品課程