求懂R语言的高手帮忙解决一下!

对以下问题编写R程序:

一、 读取各种肿瘤的病例对照数据,即病例组由患某特定肿瘤的人组成,对照组由正常人(不患任何肿瘤)组成。(Excel数据文件,ftp://10.1.70.33/R语言课件/2006秋试题/),保存为R数据文件。

二、 数据预处理:每人随机从病人中选取200人组成病例组,对照组不变。

三、 数据的预分析

探索性数据分析
1. 关于对照组(control group)
1.1 对每一个指标计算其均值、方差、标准差,作直方图(histogram)、盒形图(box-plot)和Q-Q(quantile-quantile)图等,考察每个指标的分布(distribution)和离群值(outliers)情况。
要求:对每个指标的所有图示放在一张图上,并写一个函数直接调用。

1.2 分性别,对每个指标用上述方法考察各指标是否与性别有关。
1.3 对每个指标,通过年龄与指标的散点图考察各指标与年龄是否有关。
1.4 对每一对指标,通过散点图考察两者是否相关。
1.5 计算五个指标的五阶相关矩阵(correlation matrix)考察各对指标之间的相关性。

2. 关于病例组(case group)
2.1 作如同对照组的上述预分析。
2.2 与控制组单指标的直方图、盒形图相比较,考察每个指标对肿瘤的辨别能力。
2.3 与对照组每对指标的散点图相比较,考察每对指标对诸肿瘤的辨别能力。用图示及检验的方法比较分布的差异。

回归分析
对病例组数据的五个角蛋白指标中任选一个指标,考察它与性别、年龄、以及其他四个指标的关系进行逐步回归分析;确定最优回归模型;写出分析报告。

第1个回答  2006-12-27
麻烦给介绍下R语言
第2个回答  2006-12-27
你先教教我R语言