《R语言实战》第7章基本统计分析笔记:
描述性统计分析:
使用summary函数快速获取数据的最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。apply和sapply函数提供了更灵活的手段来计算任意描述性统计量。Hmisc包中的describe函数和pastecs包中的stat.desc函数提供了详细的统计量,如变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等。psych包的describe函数进一步扩展了统计计算,包括非缺失值的数量、平均数、标准差、中位数等。
分组计算描述性统计量:
使用aggregate函数按不同维度汇总数据。by函数允许执行更复杂的数据分组操作。doBy包的summaryBy函数提供了更高级的分组计算选项,方便生成概述统计量。
频数表和列联表:
使用table函数创建基本的频数统计表。prop.table和prop.table*100将频数转换为比例和百分比。xtabs函数和gmodels包中的CrossTable函数用于创建二维列联表,并可进行卡方、Fisher和McNemar独立性检验以及计算期望、残差等。
多维列联表:
使用table、xtabs、margin.table、prop.table和addmargins函数对三个或更多类别变量进行分析。ftable函数以紧凑且吸引人的方式展示复杂数据。
独立性检验:
卡方独立性检验、Fisher精确检验和CochranMantelHaenszel检验用于判断变量间是否存在关联。
相关系数和协方差:
使用vcd包中的assocstats函数计算不同类型的统计量,如phi系数、列联系数和Cramer’s V系数等。cor函数用于计算相关系数,cov函数用于计算协方差。cor.test函数用于对单个相关系数进行显著性检验。
t检验和非参数统计方法:
独立样本t检验、非独立样本t检验用于比较两组或更多组的定量结果变量。Wilcoxon秩和检验、KruskalWallis和Friedman检验为非参数统计方法,适用于不满足t检验假设的数据。
温馨提示:答案为网友推荐,仅供参考
相似回答