主要差别有以下几种:
RD运用于quasi-experiment实验,有别于自然随机实验下直接添加dummy采用OLS估计的模型。
估计方法的不同。RD通常采用局部线性回归的方法(即不选用全样本,而选用一定带宽内的样本,),本质上是对断点周围局部效应(LATE,Local Average Treatment Effect)的一个估计。最优带宽的估计由Imbens and Kalyanaraman(2009)提供,并且一般要提供不同带宽的结果以显示结果的robustness。有时,RD还采用核回归的非参方法。
RD需要检验内生分组(endogenous sorting)的问题,即要假设如果个体事先知道分组规则,并可通过自身努力而完全控制分组变量,引起断点回归的失效。
如果在RD中加入协变量,还需检验协变量对于的条件密度是否在断点处连续,即断点处的"jump"不是由协变量的“jump”产生。
注:以上内容主要面向Sharp RD. Fuzzy RD使用时分组变量是否大于断点的dummy(称为Z)作为处理变量(称为D,即主要的估计量)的工具变量。Z显然与D相关,而Z在断点附近相当于局部随机实验,故只通过D影响变量y,与扰动项不相关,故满足外生性。可以使用Z作为D的工具变量,使用2SLS进行估计。