我已经知道了两种解释:但都看不懂
不懂得地方已经用括号写下来了
希望达人指教 多给几种解释最好,多给追加分
1.总体方差为σ2,均值为μ
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n
设A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]
=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]
而E(Xi)^2=D(Xi)+[E(Xi)]^2=σ2+μ2
E(X)^2=D(X)+[E(X)]^2=σ2/n+μ2 (为什么是N分之方差)
所以E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=n(σ2+μ2)-n(σ2/n+μ2)
=(n-1)σ2
所以为了保证样本方差的无偏性
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
E(S)=(n-1)σ2/(n-1)=σ2
2.自由度也可以解释,不是有n个与均值偏差的平方和吗?正好这n个表达式之和等于0,也就是说本来n维自由度的,受限于一个条件。所以变成了n-1维了。另外楼上说的无偏性最为根本,才是修正的根本原因。
还有一点,正是因为无偏的缘故,大样本情况下,除以n-1和n结果偏差不大,所以要追求性质更好的那个估计了。
(关键是自由度和除有什么关系)
总体的方差是由各数据与总体平均数的差值求出来的,因此必须将总体平均数 固定后才可以求总体的方差。但是由于总体平均数被固定,它就不能独立自由变化,方差受到总体平均数的限制,少了一个自由变化的机会,因此,使用样本方差来估计总体的方差时,分母的n必须改为(n-1)才不会低估总体的方差,这里(n-1)是样本的自由度,又叫总体方差的无偏估计值。
自由度是N-1,为什么要方差要除N-1????