上一期 R绘图|ggplot2散点图的绘制 简单介绍了散点图在高通量数据展示上的作用,以及如何绘制?散点图在数据展示上存在局限,只能体现基因的差异幅度,并不能体现统计学意义。因此,在高通量文章中,还有一种较为全面的展示数据特点的工具——火山图,可同时直观体现数据差异幅度和统计学意义。
如下图,火山图体现出一组数据(Test/Con)之间的差异幅度和统计学意义分布。X轴代表log2(FC);Y轴代表-log10(q value),灰色代表无差异基因,红色代表上调基因,绿色代表下调基因。X轴的取值可以是FC,也可以是log2处理后的值。X轴的取值可以是q value,也可以是p value(这两个值都属于统计值,只是使用不同方法得出)。在可视化上,形似火山,火山喷发得越高代表统计值越有意义;火山喷发得越外扩代表差异幅度越大。
今天呢,来简单演示下火山图的绘制方法,有数据的小伙伴可以试试!数据可以是高通量检测下所有基因、蛋白、代谢物、甲基化位点信息及其差异倍数和统计学数值。
扩展: 火山图其实是种可视化形式,它的数据来源不一定非得就是FC和P值,只要数据存在两个特征值(连续性数值),其中一个值有正负属性即可。比如:代谢组学数据的FC和VIP值亦可以用火山图展示;GSEA分析结果中通路的P值和NES值也可以用火山图展示。
更多内容可关注公共号“YJY技能修炼”~~~
往期回顾
R绘图|ggplot2散点图的绘制
R绘图|pheatmap热图绘制——基础篇
R绘图|pheatmap热图绘制——中阶篇
R绘图|pheatmap热图绘制——高阶篇