手把手教你用R语言下载TCGA数据:UCSCXenaTools

如题所述

对于科研爱好者们,我们深入探讨如何使用R语言下载TCGA数据,通过UCSC Xena Tools实现。在之前的文章中,我们已分享了无代码下载的方法,现在,我们将转向编程,通过R语言实现更高级的数据获取。


UCSC-Xena Tools是基于UCSC Xena平台的R包,它建立在XenaR包基础上,后者提供了简便的接口来获取包括GDC、TCGA、ICGC等众多数据库的标准化数据,尤其TCGA(hg19版本)的数据经过精心处理。但鉴于其四年未更新,UCSCXenaTools应运而生,提供了更强大的功能。


安装与使用


安装UCSCXenaTools非常简单,只需调用相应包。加载包后,你可以通过XenaHub()获取资源,通过参数筛选感兴趣的数据集。例如,指定hostName搜索TCGA相关数据,你会看到1629个选项,这时可以利用XenaFilter()进行筛选。


数据下载过程包括构建query对象,存放下载信息,然后调用XenaDownload()函数。数据默认保存在本地Xena_Data目录,如果数据已存在,XenaDownload()会提示无需重复下载。下载后,利用readr的read_tsv函数读取数据,临床信息会顺利导入R环境。


这仅仅是使用R语言下载TCGA数据的第一步,我们后续会分享更多编程下载方式。要想获取完整代码,请关注我们的公众号“百味科研芝士”,回复关键词“UCSC”即可获取R代码示例。下期再见,期待你的继续学习。

温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜