相关性分析(1):使用函数cor()或cor.test()来计算相关系数

如题所述

相关性分析用于评估两个或多个变量之间的关联。在数据呈正态分布时,可以使用相关性分析。在R语言中,可使用`cor()`或`cor.test()`函数计算相关系数。

使用方法如下:

简化格式为:

cor(x, y, method = c("pearson", "kendall", "spearman"))

cor.test(x, y, method=c("pearson", "kendall", "spearman"))

例如,以`my_data$mpg`和`my_data$wt`变量为例:

可以使用`head()`和`tail()`函数检查数据,这将分别显示数据的第一部分和最后一部分。

计算相关系数:

> cor(my_data$mpg,my_data$wt,method="pearson",use="complete.obs") [1] -0.8676594 > cor.test(my_data$mpg,my_data$wt,method="pearson",use="complete.obs") Pearson's product-moment correlation data: my_data$mpg and my_data$wt t = -9.559, df = 30, p-value = 1.294e-10 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.9338264 -0.7440872 sample estimates: cor -0.8676594

可以看出,`mpg`与`wt`之间的相关系数是-0.87,呈负相关,其95%可信区间为-0.93到-0.74,P值为1.294e-10。这说明两者高度相关。

最后,可以使用R函数`plot()`进行可视化。

相关性分析的简单实现介绍完毕,后续将分享相关性可视化、`corrmorant`和`cols4all`包的使用。
温馨提示:答案为网友推荐,仅供参考
相似回答