1.均值
一般来讲,均值指的是
算术平均值,计算非常简单。
Excel中直接=AVERAGE(x1,x2...xn)或者=sum(x1,x2...xn)/n即得。
2.标准差
标准差即样本中各个个体与其平均数的差的平方的
算术平均数的平方根,反映的是一个数据集的
离散程度,值越大,越离散,即个体间差异越大。
标准差又分为
样本标准差和总体标准差。
总体包含样本,由样本去估计总体。通常情况下我们估计应该偏保守一点,由样本标准差去估计总体标准差时,应比总体的实际标准差偏大一点,所以在n上做了一点小文章。
样本标准差=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/(n-1))=STDEV.S(x1,x2...xn)
总体标准差=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n)=STDEV.P(x1,x2...xn)
3.标准误差
标准误差简单理解即是对平均数求标准差,比如一次实验会得到一个平均数,多次实验得到多个平均数,标准误差即是对这些平均数求标准差。
其实际意义即是用来表示样本均值与总体均值的离散程度,标准误越小,样本均值和总体均值差距则越小,反之越大。标准误用于预测样本数据准确性 ,标准误越小,样本均值和总体均值差距越小,样本数据越能代表总体数据。
由于我们不可能做很多次实验,所以标准误差通常由样本的标准差除以
样本容量的开平方来估算的。
标准误差=样本标准差/sqrt(n)=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n(n-1))=STDEV.S(x1,x2...xn)/sqrt(n)
或
标准误差=总体标准差/sqrt(n-1)=STDEV.P(x1,x2...xn)/sqrt(n-1)
其他
已知一箱子中有未知个号码,第一次摸出号码1,放进去第二次摸出号码2,再放进去第3次摸出号码3,问下一次摸出号码1的概率是多少?
Excel公式解为=Z.TEST({1,2,3},1)=0.041632
看看公式是如何计算的:
样本{1,2,3}的均值为(1+2+3)/3=2
样本{1,2,3}的标准差为sqrt(((1-2)^2+(2-2)^2+(3-2)^2)/(3-1))=1(根据评论指出的错误,已修正)
样本{1,2,3}的标准误差为1/sqrt(3)=0.57735
标准化z得分为(1-2)/0.57735=-1.73205
即z(-1.73205)=0.041632