RCS限制性立方样条-高分套路全解析

如题所述

临床连续数据与结局的线性关联方式与模型优化是一个重要问题。医学常见非线性曲线形态如S、L、log-log、J、threshold、U、∩ 形态。数据拟合越接近真实关联曲线形态,预测性能越佳。统计学家George Box 的名言提醒我们,所有模型并非绝对正确,但可能有所用处。RCS(限制性立方样条)就是这样一种方法,能提供模型拟合线索,使模型更好用,数据分析更亮眼。

线性回归、Logistic回归、Cox回归探讨连续自变量与因变量关系时,要求合适的链接函数,保证自变量与因变量符合一般/广义线性前提条件。其中线性前提条件转换可参考后续章节,如正态转换、logitP转换。但若假设不成立,如何探讨自变量与因变量是线性还是非线性关联?平滑函数,如核平滑、多项式平滑和样条平滑,可以实现。核平滑使用一组局部权重生成平滑估计,但实际应用中难以实现。多项式是一种简单估计方法,但存在过拟合、共线性、全局性问题。样条本质上是连续平滑的分段三次多项式,要求分段点连续且二阶可导,以保证平滑性。

RCS(限制性立方样条)是连续平滑的分段三次多项式,通过选择节点的位置和数量,拟合样条函数RCS(X),使连续变量X在整个取值范围内呈现光滑曲线。Restricted RCS在回归样条的基础上附加线性约束条件,使得预测更为准确。RCS通过样条函数RCS(X)转换自变量X后,根据因变量分布类型选择链接函数,拟合模型g(Y)=常数项+RCS(X)+其他自变量。节点位置对样条函数拟合影响不大,节点数量对曲线形状影响较大。推荐knot=4,节点数量为3-5时样条函数拟合较好。

RCS形状受节点数量影响很大,节点越多曲线越复杂。RCS只能判断非线性趋势,提供切点线索,而不能精确提供切点。在SCI实战中,BMJ、EI文章对于RCS非线性关系描述详细,采用中位数设置为拐点,从图中可以看出趋势。RCS图既直观又输出p for non-linearity值,描述x与y之间的非线性关系,发现潜在的有趣切点。主流RCS表达套路包括RCS+ HR左右开弓、RCS+直方图、RCS+密度图。

选择分位数还是RCS取决于情况。连续数据第一选择依据临床共识进行分类,但可能削弱预测能力。忽略连续数据非线性形态,直接引入分类进行模型预测,容易丢失信息。选择RCS优于分类,RCS后再根据图形定性形态,选择对应的knots点、临床界值、ROC界值、中位数、分位数、segmented包分段对应切点进行分析。

其他非线性拟合方法包括B样条、广义加性模型(GAM)。B样条使用节点控制灵活性,比受限制的三次样条具有更灵活的尾部。GAM专门研究非线性关系,用于非线性关系提供线索或直接参与GAM模型构建,尤其在环境研究领域常用。

代码示例包括R语言的logistic与cox回归,使用R软件进行模型构建与分析。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜