生信小白莫慌!一站式GEO数据挖掘教程来啦!零代码也能搞定生信SCI!

如题所述

小伙伴们,大家好!在前面的推文中,我们介绍了如何利用仙桃工具复现SCI文章中常见的图形,感兴趣的小伙伴可以在挑圈联靠公众号查看前面的推文。本期,我们将介绍如何利用仙桃工具在GEO数据库中进行一站式的数据挖掘。
GEO数据库,全称为GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,提供免费下载。它是科研人的好帮手,网址是 ncbi.nlm.nih.gov/geo/,包含多种平台数据,包括芯片数据、高通量数据(如RNAseq、ChIP、单细胞测序数据等)。由于数据来源广泛,同一平台的数据情况多样,可能有数据缺失的情况。
接下来,让我们一起学习如何利用仙桃工具进行GEO数据库的一站式数据挖掘!
首先,进入仙桃学术工具(xiantao.love)并点击【数据集检索】。
页面展示了检索结果,包括数据集基本信息、跳转链接(如GEO2R)以及是否能直接添加到样本库的按钮。目前,数据库收录了大约5400个数据集,涉及6-200个样本量的数据集,涵盖了GPL570平台下的数据集。
如果只想要直接进行分析的数据集,可以通过过滤条件筛选出未收录的数据集。如果数据集下方有「选择样本」按钮,说明这个数据集可以添加样本。选择样本后,点击「添加到样本库」。
进入「我的样本库」,可以在此进行样本分组和后续分析。选择样本并分组后,点击「提交分析」,系统会记录分析任务并提供分析结果下载。
仙桃学术提供多种结果内容,包括箱式图、PCA图、UMAP图、火山图、差异分析结果表格等,并提供详细的分析说明和下载链接。高级版用户可进行个性化结果调整,包括配色、样式等。
以上就是如何利用仙桃工具进行GEO数据库一站式数据挖掘的介绍。接下来,我们通过一个具体例子来演示实际操作。
我们以2018年12月发表在“Scientific reports(IF= 4.379)杂志上的一篇文章为例,文章名为“Transcriptomic and functional network features of lung squamous cell carcinoma through integrative analysis of GEO and TCGA data”。我们将使用仙桃学术工具进行数据挖掘。
进入仙桃学术(xiantao.love)并点击【数据集检索】。选取数据集GSE33532进行示范。在搜索框输入GSE33532,可以看到该数据集已被工具收录,可以进行分析。
该数据集包含100例样本,其中20例为Normal样本,80例为Tumor样本。选择全部样本,点击“添加到样本库”。进入样本库,根据“Source name”将样本分组,显示参考组20个,实验组80个。点击右侧“提交分析”。提交后,可在历史记录中下载分析结果。
点击下载,查看部分分析结果展示,包括箱式图和PCA图。
本期内容介绍到这里,希望对大家的科研工作有所帮助。我们下期再见!
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜