比如想要了解高中生的母亲受教育年数和学生的科学素养是否有关联,测得19名学生的母亲受教育年数和学生的科学素养数据如下。
分析:由于是分析不同组别之间的相关性(差异性),由于组别是二分类变量,所以考虑使用t检验或者非参数检验,由于数据基本服从正态分布,所以采用t检验和可视化图形进行结合分析。
正态检验的结果如下:
从结果中可以看到,模型不显著,接受原假设说明数据服从正态分布。
01、分析流程
此案例的相关分析分析流程,大体可以分为五步:
整理成正确的数据格式;
进行散点图查看;
验证相关分析的前提条件;(前提条件:正态分布、)
进行操作;
相关的结果分析;
Step1:
整理数据格式,一个分析项为一列。
Step2:
pearson相关分析的前提条件:
两变量为连续变量
两变量存在线性关系
两变量呈现正态分布
Step3:进行绘制散点图
简单查看下数据的关系。
Step4:相关分析操作
上传数据后,点击通用方法的相关分析,然后将分析项拖拽到对应分析框内,点击开始分析。
Step5:相关的结果分析;
02、解读分析结果
1)散点图
从散点图可以看出,散点是杂乱无章的,从图中看起来学生科学素养与母亲受教育年限大概没有关系,可以进一步查看相关分析。
从相关分析的结果中可以看出,相关系数为0.08,说明二者之间的关系极弱,以及p值大于0.1说明整体模型不显著,拒绝原假设,二者没有相关关系。
03、指标解读
对于pearson相关系数具体如何计算呢?
计算过程如下: