断点回归设计与添加虚拟变量有什么区别

如题所述

主要差别有以下几种:
RD运用于quasi-experiment实验,有别于自然随机实验下直接添加dummy采用OLS估计的模型。
估计方法的不同。RD通常采用局部线性回归的方法(即不选用全样本,而选用一定带宽内的样本,),本质上是对断点周围局部效应(LATE,Local Average Treatment Effect)的一个估计。最优带宽的估计由Imbens and Kalyanaraman(2009)提供,并且一般要提供不同带宽的结果以显示结果的robustness。有时,RD还采用核回归的非参方法。
RD需要检验内生分组(endogenous sorting)的问题,即要假设如果个体事先知道分组规则,并可通过自身努力而完全控制分组变量,引起断点回归的失效。
如果在RD中加入协变量,还需检验协变量对于的条件密度是否在断点处连续,即断点处的"jump"不是由协变量的“jump”产生。
注:以上内容主要面向Sharp RD. Fuzzy RD使用时分组变量是否大于断点的dummy(称为Z)作为处理变量(称为D,即主要的估计量)的工具变量。Z显然与D相关,而Z在断点附近相当于局部随机实验,故只通过D影响变量y,与扰动项不相关,故满足外生性。可以使用Z作为D的工具变量,使用2SLS进行估计。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-01-26
还是用录取学校这个例子来说
假设要研究录取到一本学校对学生未来工资的影响
首先,没法做随机试验是肯定的
现在如果我们用OLS的方法,为了排除“录取到一本学校”这个treatment的内生性
我们就要往加入足够多的解释变量,比如说家庭教育,个人能力,经济能力等等等,变量越多估计结果越准确。以及和这个treatment的虚拟变量
但如果我们只加入一个虚拟变量,说明我们默认了是否被录取一本学校对不用能力、不同家庭背景的学生的影响都是一样的,这显然让人难以信服
为了更好地识别录取到一本学校的影响,我们再往方程里加入它与各个变量的交互项,这个回归跑出来,理论上我们就可以得出,对于任意一类学生,是否录取到一本学校对他的影响有多大



想想都知道一旦变量多起来这个回归有多不靠谱

但是如果用断点回归的方法,我们起码可以在有限的数据集中估计出一个相对准确的结果
在“连续性”的假设下,我们并不需要控制住那么多变量,因为我们认为以running variable为参考的某个点附近,比如高考分500分附近的人,他们的学习成绩,乃至智商、情商、abcdQ等其他因素都是差不多的(这个说法可能要斟酌一下),而在这个499分和500分这群人差不多的人以后工资的差异,就可以被看做是录取到一本学校的纯的影响。但显然,这个影响显然是针对那群差不多的人而言的,对另一群学生来说,这个影响就毫无说服力了,因为你认为录取到一本学校的影响对于不同群体而言是不一样的。这句话是不是和上面下划线那句话很像(其实就是一个意思嘛)。

所以我认为两者的关系是,RD(上面其实是个Sharp RD的例子)估计出来的影响,相当于在回归方程中加入足够多的虚拟变量交互项,再估计出treatment在某个点的偏效应。多元回归做不好这件事,而RD能做好。本回答被网友采纳
第2个回答  2016-01-29

主要差别有以下几种:

    RD运用于quasi-experiment实验,有别于自然随机实验下直接添加dummy采用OLS估计的模型。

    估计方法的不同。RD通常采用局部线性回归的方法(即不选用全样本,而选用一定带宽内的样本,),本质上是对断点周围局部效应(LATE,Local Average Treatment Effect)的一个估计。最优带宽的估计由Imbens and Kalyanaraman(2009)提供,并且一般要提供不同带宽的结果以显示结果的robustness。有时,RD还采用核回归的非参方法。

    RD需要检验内生分组(endogenous sorting)的问题,即要假设如果个体事先知道分组规则,并可通过自身努力而完全控制分组变量,引起断点回归的失效。

    如果在RD中加入协变量,还需检验协变量对于的条件密度是否在断点处连续,即断点处的"jump"不是由协变量的“jump”产生。

注:以上内容主要面向Sharp RD. Fuzzy RD使用时分组变量是否大于断点的dummy(称为Z)作为处理变量(称为D,即主要的估计量)的工具变量。Z显然与D相关,而Z在断点附近相当于局部随机实验,故只通过D影响变量y,与扰动项不相关,故满足外生性。可以使用Z作为D的工具变量,使用2SLS进行估计。

相似回答