Pearson、Spearman、Polyserial相关系数简介及R计算

如题所述

第1个回答  2024-10-19
衡量变量间关联强度和方向的关键工具是相关系数,如Pearson、Spearman、Kendall、Polychoric等。这些系数在+1和-1之间变化,表示了变量间的关系强度和方向。正相关(如Pearson)意味着随着一个变量增加,另一个也随之增强,负相关则反之;零值代表不相关。

Pearson相关系数适用于连续变量,依赖于数据的正态分布和线性关系假设。Spearman秩相关则更稳健,适用于非参数和有序变量,对异常值不敏感,但可能略去一些弱线性关系。Kendall相关适用于分类变量,通过比较配对的等级来判断变量间的关联。

Polychoric相关适用于有序变量间的关联,如二元正态分布的Tetrachoric相关,而Polyserial和Biserial相关则处理定量与序数变量的线性关系。在R语言中,cor()函数用于计算Pearson、Spearman和Kendall相关,而心理统计包如psych和ltm提供了计算Polychoric、Tetrachoric以及特殊形式相关系数的方法。

理解了这些系数后,进行相关性分析时,还需注意,相关性并不意味着因果关系,通常用于描述变量间的关系强度,但需进一步的统计检验来确认其显著性。
相似回答