一般地,總平方和、因子平方和不會相等。之間的差額就是誤差平方和。當然,為了驗證平方和分解,還要計算一下誤差平方和。
為了能使用f分布進行統計檢驗,還需要用到自由度的概念來構造符合f分布的統計值。
自由度(degree of freedom, df),在數學中能夠自由取值的變量個數,如有3個變量x、y、z,但x+y+z=18,其自由度等于2。在統計學中,自由度指的是計算某一統計量時,取值不受限制的變量個數。通常df=n-k。其中n為樣本含量,k為被限制的條件數或變量個數,或計算某一統計量時用到其它獨立統計量的個數。電子游戲中也有自由度這個概念。這個,我就不清楚了。統計學上的自由度是指當以樣本的統計量來估計總體的參數時,
樣本中獨立或能自由變化的資料的個數,稱為該統計量的自由度。 統計學上的自由度包括兩方面的內容:
首先,在估計總體的平均數時,由于樣本中的 n 個數都是相互獨立的,從其中抽出任何一個數都不影響其他數據,所以其自由度為n。 在估計總體的方差時,使用的是離差平方和。只要n-1個數的離差平方和確定了,方差也就確定了;因為在均值確定后,如果知道了其中n-1個數的值,第n個數的值也就確定了。這里,均值就相當于一個限制條件,由于加了這個限制條件,估計總體方差的自由度為n-1。例如,有一個有4個數據(n=4)的樣本, 其平均值m等于5,即受到m=5的條件限制, 在自由確定4、2、5三個數據后, 第四個數據只能是9, 否則m≠5。因而這里的自由度v=n-1=4-1=3。推而廣之,任何統計量的自由度v=n-限制條件的個數。