R语言:DNA序列比对后计算遗传距离(P-distance)

如题所述

第1个回答  2022-06-23

在R语言中找到了计算遗传距离的函数dist.dna();但是不知道在R里面如何利用循环批量处理文件计算遗传距离。想到了利用python来调用R函数的方法,查找相关教程发现需要用到rpy2模块。
easy_install rpy2 报错(看不懂报错内容);
pip install rpy2 报错(提示需要更新pip到pip19.0.3);
利用 python -m pip install --upgrade pip 更新pip报错(看不懂报错内容);
利用 https://pip.pypa.io/en/stable/installing/ 教程安装pip成功更新。
使用 pip install rpy2 安装依旧报错(看不懂报错内容);
尝试教程 https://blog.csdn.net/suzyu12345/article/details/51476321 安装rpy2,提示 rpy2-2.9.5-cp37-cp37m-win_amd64.whl is not a supported wheel on this platform
在rpy2主页 https://rpy2.bitbucket.io/ 发现一句话 Releasend source packages are available on PyPi. Installing should be as easy * as

(*:except on Windows)
这意思是在windows系统使用pip安装不太容易吗?
找到了教程 rpy2:在python中调用R函数的一个实例 ;发现其中rpy2的安装使用的是conda,自己也尝试在windows的DOS窗口下使用 conda install rpy2 成功。但是结尾处提示了一句 此时不应有do 不明白是什么意思
在python中加载R包查到可以使用

加载R语言自带的包时没有遇到问题;但是加载需要额外安装的包时遇到了报错

按照教程 https://blog.csdn.net/arcers/article/details/79109535 使用 conda install -c r r-ggplot2 安装需要用到的包解决问题

一个简便描述序列分歧大小的测度是两条核苷酸序列中不同核苷酸位点的比例 P = nd/n;
nd为检测两条序列间不同核苷酸数;n为配对总数;P成为核苷酸间的p距离

相似回答