第1个回答 2024-08-16
R语言中的药敏分析工具,pRRophetic和oncoPredict,是由同一位作者开发的。oncoPredict被视为pRRophetic的升级版本,两者的使用方法相似,只是训练数据集有所不同。在使用前,了解常用的药敏数据库如GDSC、CTRP、CCLE等是必要的,可在相关文献或数据库主页获取详细信息。
pRRophetic的基本原理是通过已知的细胞系表达矩阵和药物敏感性数据建立模型,然后预测新的表达数据的药物反应。作者在其文章中详细阐述了这一方法,包括使用芯片数据的表达矩阵,经过预处理后,通过岭回归分析预测药物IC50值。
尽管pRRophetic版本较老,但可通过下载pRRophetic_0.5.tar.gz进行安装,可能需要兼容的R版本,如R4.2.0。在安装过程中,可能会遇到报错,但已有人分享了解决方案。包的GitHub提供了预测不同组别患者对化疗药物敏感性的示例。
预测时,用户可以提供自己的表达矩阵,包会使用CGP数据(如cgp2014或cgp2016)作为训练集进行预测,得到每个样本的IC50值。若数据不符合正态分布,可能需要使用不同的预测函数,如pRRopheticLogisticPredict。
为了评估预测准确性,pRRopheticCV提供了5折交叉验证,展示真实结果和预测结果的对比。尽管CCLE数据量较少,但包支持使用自定义的训练集进行预测,这增加了灵活性。
包中还包含了自带的数据集供用户探索,如cgp2016的基因表达矩阵和药物敏感性信息。预测所有药物敏感性时,需要循环处理数据并进行可视化,这强调了熟悉R语言基础的重要性。