R-PCA-prcomp()-ggplot2-学习笔记

如题所述

第1个回答  2024-10-27
PCA是数据挖掘领域常用的降维算法,其发展始于Pearson于1901年的研究,后由Hotelling在1933年进一步发展,主要应用于数据降维,展现最大个体差异,简化回归分析和聚类分析中的变量数量。

以R语言自带的iris数据集为例,执行PCA分析。

数据集前四列代表不同因素,最后一列是物种标识。

通过使用prcomp()函数进行PCA分析。

得到分析结果后,提取了主成分的得分,即点的PC1和PC2坐标值。

接下来,利用ggplot2进行PCA结果的可视化。

首先,提取主成分的方差贡献率,生成坐标轴标题。

通过summary()函数计算分析结果,将重要性矩阵的方差贡献率转换为百分比形式,生成标题文本。

设置绘图参数,包括数据集、坐标轴标题、颜色映射等。

利用ggplot()函数创建基本图形,添加点、椭圆,设置坐标轴标题、颜色映射和填色。

通过scale_fill_manual()和scale_colour_manual()函数自定义颜色映射。

最终,展示PCA结果的可视化图表,展示不同记录的PC1和PC2得分,以及物种间的分布情况,通过颜色区分不同物种。
相似回答
大家正在搜