断点回归设计与添加虚拟变量有什么区别

如题所述

推荐答案 2018-07-29

主要差别有以下几种：
RD运用于quasi-experiment实验，有别于自然随机实验下直接添加dummy采用OLS估计的模型。
估计方法的不同。RD通常采用局部线性回归的方法（即不选用全样本，而选用一定带宽内的样本，），本质上是对断点周围局部效应（LATE，Local Average Treatment Effect)的一个估计。最优带宽的估计由Imbens and Kalyanaraman(2009)提供，并且一般要提供不同带宽的结果以显示结果的robustness。有时，RD还采用核回归的非参方法。
RD需要检验内生分组（endogenous sorting)的问题，即要假设如果个体事先知道分组规则，并可通过自身努力而完全控制分组变量，引起断点回归的失效。
如果在RD中加入协变量，还需检验协变量对于的条件密度是否在断点处连续，即断点处的"jump"不是由协变量的“jump”产生。
注：以上内容主要面向Sharp RD. Fuzzy RD使用时分组变量是否大于断点的dummy（称为Z）作为处理变量（称为D，即主要的估计量）的工具变量。Z显然与D相关，而Z在断点附近相当于局部随机实验，故只通过D影响变量y，与扰动项不相关，故满足外生性。可以使用Z作为D的工具变量，使用2SLS进行估计。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/7BtW7eOjvjeXB7eXvB.html

其他回答

第1个回答 2016-01-26

还是用录取学校这个例子来说
假设要研究录取到一本学校对学生未来工资的影响
首先，没法做随机试验是肯定的
现在如果我们用OLS的方法，为了排除“录取到一本学校”这个treatment的内生性
我们就要往加入足够多的解释变量，比如说家庭教育，个人能力，经济能力等等等，变量越多估计结果越准确。以及和这个treatment的虚拟变量
但如果我们只加入一个虚拟变量，说明我们默认了是否被录取一本学校对不用能力、不同家庭背景的学生的影响都是一样的，这显然让人难以信服
为了更好地识别录取到一本学校的影响，我们再往方程里加入它与各个变量的交互项，这个回归跑出来，理论上我们就可以得出，对于任意一类学生，是否录取到一本学校对他的影响有多大
。
。
。
想想都知道一旦变量多起来这个回归有多不靠谱

但是如果用断点回归的方法，我们起码可以在有限的数据集中估计出一个相对准确的结果
在“连续性”的假设下，我们并不需要控制住那么多变量，因为我们认为以running variable为参考的某个点附近，比如高考分500分附近的人，他们的学习成绩，乃至智商、情商、abcdQ等其他因素都是差不多的（这个说法可能要斟酌一下），而在这个499分和500分这群人差不多的人以后工资的差异，就可以被看做是录取到一本学校的纯的影响。但显然，这个影响显然是针对那群差不多的人而言的，对另一群学生来说，这个影响就毫无说服力了，因为你认为录取到一本学校的影响对于不同群体而言是不一样的。这句话是不是和上面下划线那句话很像（其实就是一个意思嘛）。

所以我认为两者的关系是，RD（上面其实是个Sharp RD的例子）估计出来的影响，相当于在回归方程中加入足够多的虚拟变量交互项，再估计出treatment在某个点的偏效应。多元回归做不好这件事，而RD能做好。本回答被网友采纳

第2个回答 2016-01-29

主要差别有以下几种：

RD运用于quasi-experiment实验，有别于自然随机实验下直接添加dummy采用OLS估计的模型。

估计方法的不同。RD通常采用局部线性回归的方法（即不选用全样本，而选用一定带宽内的样本，），本质上是对断点周围局部效应（LATE，Local Average Treatment Effect)的一个估计。最优带宽的估计由Imbens and Kalyanaraman(2009)提供，并且一般要提供不同带宽的结果以显示结果的robustness。有时，RD还采用核回归的非参方法。

RD需要检验内生分组（endogenous sorting)的问题，即要假设如果个体事先知道分组规则，并可通过自身努力而完全控制分组变量，引起断点回归的失效。

如果在RD中加入协变量，还需检验协变量对于的条件密度是否在断点处连续，即断点处的"jump"不是由协变量的“jump”产生。

注：以上内容主要面向Sharp RD. Fuzzy RD使用时分组变量是否大于断点的dummy（称为Z）作为处理变量（称为D，即主要的估计量）的工具变量。Z显然与D相关，而Z在断点附近相当于局部随机实验，故只通过D影响变量y，与扰动项不相关，故满足外生性。可以使用Z作为D的工具变量，使用2SLS进行估计。

相似回答

断点回归设计与添加虚拟变量有什么区别答：RD（regression discontinuity design）即断点归断点归近政策评估非重要没随机性情况识别政策效

经济学上有种分析问题的方法叫“断点回归法”,哪位高人知道它的主要...答：断点回归是一种计量方法，是一种拟随机试验，一个系统的整理请参考David S. Lee and Thomas Lemieux（2010）的论文。举个极端的例子（只是打个比方），当你想知道能否上北大与未来成就的关系时，与直接将未来成就的量化指标（年薪）对是否上北大这个虚拟变量回归的方法不同，你也可以找到某一年某个省份...

如何运用断点回归的方法来检测数据造假?答：运用图形来分析处置效应是否存在是断点回归分析的基础。图形分析在断点回归的实施中扮演着重要的角色，通过将样本点和决定处置的关键变量在坐标系中描述出来，便可以清楚的看到临界值附近的样本点是否存在跳跃。如果样本点存在跳跃，那么说明确实存在处置效应，相反，如果样本点没有出现相应的跳跃，那么说明断点...

断点回归设计与添加虚拟变量有什么区别答：主要差别有以下几种：RD运用于quasi-experiment实验，有别于自然随机实验下直接添加dummy采用OLS估计的模型。估计方法的不同。RD通常采用局部线性回归的方法（即不选用全样本，而选用一定带宽内的样本，），本质上是对断点周围局部效应（LATE，Local Average Treatment Effect)的一个估计。最优带宽的估计由...

大家正在搜

stata回归中虚拟变量为自变量虚拟变量怎么做回归多个虚拟变量怎么回归 stata虚拟变量怎么回归多元回归虚拟变量虚拟变量回归命令虚拟变量回归结果分析什么是虚拟变量虚拟变量回归模型