断点回归设计:局部随机化、带宽选择与有效性检验
1 断点回归设计的直觉与识别逻辑
1.1 基本思想
断点回归设计(Regression Discontinuity Design, RDD) 利用一个运行变量(running variable) $X_i$ 决定处理的"规则":当 $X_i$ 越过某阈值 $c$ 时,处理状态(或处理概率)出现不连续跳跃。
识别逻辑的关键直觉:
- 在阈值 $c$ 附近,$X_i$ 略高于 $c$ 者(receive treatment)与略低于 $c$ 者(no treatment)在所有其他相关特征上几乎相同——因为是否越过阈值接近于"随机",尤其是当个体对自身精确位置无完全控制时。
- 因此,在阈值附近的条件下,两组个体的反事实潜在结果分布相似,处理效应可以识别。
1.2 RDD 的历史背景
RDD 最初由 Thistlethwaite & Campbell(1960)提出,研究奖学金对学生未来成就的影响——奖学金按考试分数的门槛分配,门槛附近的学生几乎同等水平,只因略超/未超门槛而导致处理状态不同。
此后被广泛应用于:选举效应(投票率阈值)、教育政策(班级规模阈值、保留级)、社会福利(收入资格线)、医学政策(血压/年龄阈值)等。
2 Sharp RDD
2.1 形式化定义
Sharp RDD(完全断点回归) 中,处理状态 $D_i$ 完全由运行变量决定:
$$D_i = \mathbf{1}[X_i \geq c]$$
识别假设(连续性假设):
$$\mathbb{E}[Y_i(0) | X_i = x] \quad \text{和} \quad \mathbb{E}[Y_i(1) | X_i = x] \quad \text{在 } x = c \text{ 处连续}$$
即:如果在阈值处没有处理,潜在结果的条件期望函数是连续的——个体的"基线表现"不会在阈值处跳跃。
识别结论:RDD 估计量识别阈值处的局部平均处理效应(LATE at the cutoff):
$$\tau_{\text{RDD}} = \lim_{x \downarrow c} \mathbb{E}[Y_i | X_i = x] - \lim_{x \uparrow c} \mathbb{E}[Y_i | X_i = x]$$
$$= \mathbb{E}[Y_i(1) - Y_i(0) | X_i = c]$$
注意:RDD 仅识别阈值处的局部效应,对远离阈值的个体不做因果推断。
2.2 图形分析
RDD 的最直观呈现是散点图 + 拟合曲线:以 $X_i$ 为横轴,$Y_i$ 为纵轴,在阈值两侧拟合回归曲线,观察阈值处是否出现不连续跳跃。
好的 RDD 图:
- 阈值附近有可见的跳跃
- 两侧趋势平滑(无非线性结构)
- 数据密度在阈值处无明显跳跃(否则提示操纵)
3 估计方法:局部多项式估计器
3.1 局部线性回归
给定带宽 $h > 0$,对 $x \in [c-h, c+h]$ 内的样本分别在阈值两侧做线性回归:
右侧回归($X_i \in [c, c+h]$):
$$Y_i = \alpha_R + \beta_R (X_i - c) + \varepsilon_i$$
左侧回归($X_i \in [c-h, c]$):
$$Y_i = \alpha_L + \beta_L (X_i - c) + \varepsilon_i$$
RDD 估计量:$\hat\tau = \hat\alpha_R - \hat\alpha_L$(两条回归线在 $c$ 处的截距之差)
通常使用核加权(kernel weighting),给距阈值更近的观测更高权重(三角核或矩形核):
$$w_i = K\left(\frac{X_i - c}{h}\right)$$
3.2 局部多项式($p$ 阶)
更一般地,可用 $p$ 阶局部多项式。局部线性($p=1$) 在实践中最常推荐(Gelman & Imbens, 2019):
- 相比局部常数($p=0$),局部线性对设计变量密度函数的依赖更小(边界校正好)
- 相比高阶多项式($p \geq 2$),局部线性不容易过拟合,置信区间覆盖率更好
- Gelman & Imbens(2019)明确反对使用全局高次多项式($p \geq 4$)进行RDD估计
3.3 最优带宽选择(CCT方法)
带宽选择是RDD估计的核心问题:
- 带宽过小:样本量少,估计量方差大
- 带宽过大:非阈值区域混入,偏差增大
Calonico, Cattaneo & Titiunik(CCT,2014) 提出了 RDD 最优带宽的均方误差最小化选法:
$$h_{\text{MSE}}^* = \arg\min_h \left[\text{Bias}(\hat\tau, h)^2 + \text{Var}(\hat\tau, h)\right]$$
CCT带宽选择公式(局部线性情形):
$$h^* = C_n \cdot \left(\frac{\sigma_+^2(c) + \sigma_-^2(c)}{(m_+’’(c))^2 + (m_-’’(c))^2}\right)^{1/5} \cdot n^{-1/5}$$
其中 $\sigma_{\pm}^2(c)$ 是阈值两侧的条件方差,$m_{\pm}’’(c)$ 是条件均值函数的二阶导数(代表曲率/偏差)。
推断校正:CCT 还提出了偏差校正置信区间(bias-corrected confidence intervals),解决了传统带宽下推断保守性不一致的问题,已成为当前实践标准。
软件实现(推荐):
library(rdrobust)
# 默认CCT带宽的局部多项式RDD
rd_fit <- rdrobust(y = Y, x = X, c = cutoff)
summary(rd_fit)
# 展示带宽范围的稳健性
rdbwselect(y = Y, x = X, c = cutoff)
4 Fuzzy RDD
4.1 模型设置
Fuzzy RDD:当运行变量越过阈值时,处理概率出现不连续跳跃,而非完美确定处理(可能存在不服从):
$$P(D_i = 1 | X_i = x) = \begin{cases} p_+(x) & x \geq c \ p_-(x) & x < c \end{cases}$$
且 $\lim_{x \downarrow c} p_+(x) \neq \lim_{x \uparrow c} p_-(x)$(跳跃存在)。
4.2 Fuzzy RDD 作为 IV 估计
Fuzzy RDD 可视为以越过阈值 $Z_i = \mathbf{1}[X_i \geq c]$ 为工具变量、以实际处理 $D_i$ 为内生变量的 IV 估计:
$$\tau_{\text{Fuzzy}} = \frac{\lim_{x \downarrow c}\mathbb{E}[Y_i | X_i=x] - \lim_{x \uparrow c}\mathbb{E}[Y_i | X_i=x]}{\lim_{x \downarrow c}\mathbb{E}[D_i | X_i=x] - \lim_{x \uparrow c}\mathbb{E}[D_i | X_i=x]}$$
分子是结果的跳跃,分母是处理概率的跳跃(“第一阶段”)。Fuzzy RDD 识别的是阈值处顺从者的局部平均处理效应:
$$\tau_{\text{Fuzzy}} = \mathbb{E}[Y_i(1) - Y_i(0) | X_i = c, \text{complier}]$$
5 有效性检验(Validity Tests)
RDD 的识别依赖连续性假设,需通过以下检验进行验证:
5.1 操纵检验(McCrary Density Test)
问题:若个体能精确控制运行变量,可能"操纵"自己越过(或不越过)阈值,导致阈值处的潜在结果分布不连续,识别假设失效。
McCrary(2008)密度检验:若存在操纵,阈值处观测密度将出现不连续性——门槛以上"堆积"(bunching)或门槛以下"缺失"。
零假设:$\lim_{x \downarrow c} f(x) = \lim_{x \uparrow c} f(x)$(密度在阈值处连续)
library(rddensity)
rddensity_fit <- rddensity(X = X, c = cutoff)
rdplotdensity(rddensity_fit, X)
5.2 协变量连续性检验(Covariate Smoothness)
以前定变量(predetermined covariates) $Z_i$(在处理前确定的特征)作为结果变量,检验其在阈值处是否有跳跃。若 $Z_i$ 在阈值处跳跃,说明阈值附近的两组个体在处理前已系统性不同,连续性假设可疑。
# 对每个协变量做RDD
rdrobust(y = Z1, x = X, c = cutoff)
rdrobust(y = Z2, x = X, c = cutoff)
5.3 安慰剂截断点检验(Placebo Cutoff Tests)
在非真实截断点(如 $c \pm \delta$)处重复RDD估计,检验是否出现异常跳跃。若非真实截断点也有显著跳跃,提示结果的跳跃并非处理引起。
5.4 带宽稳健性检验
在不同带宽 $h \in {0.5h^, h^, 2h^*}$ 下重复估计,报告点估计和置信区间的稳定性。一个可靠的RDD结论应在合理带宽范围内保持稳健。
6 RDD 的局限与扩展
6.1 主要局限
- 仅识别局部效应:政策含义受限,只对阈值附近个体有效,外推性弱
- 阈值附近样本量有限:精度可能较低,尤其在样本量有限时
- 需要识别假设不可检验:连续性假设本身无法直接验证,只能通过间接证据支持
6.2 扩展方向
地理断点回归(Geographic RDD):以地理边界(如行政边界)作为"阈值",如研究边境两侧的政策效应差异。
时间断点回归(Event Study / Time RDD):以时间阈值作为运行变量,研究某政策实施前后的效应(与DID密切相关)。
带协变量的RDD:将协变量 $Z_i$ 加入局部线性回归(Lin, 2013的思路),可减小方差,提升精度(但不改变识别策略)。
7 小结与实践清单
RDD 实证研究的标准流程:
- ✅ 绘制RDD图:散点bin-plot + 分组拟合曲线,直观检验跳跃
- ✅ McCrary密度检验:排除运行变量操纵
- ✅ 协变量平衡检验:验证阈值附近的可比性
- ✅ CCT最优带宽:使用默认带宽估计主要结果
- ✅ 偏差校正置信区间:使用CCT推断方法
- ✅ 带宽稳健性:报告不同带宽下的估计值
- ✅ 安慰剂截断点:排除虚假跳跃
- ✅ 局部多项式次数稳健性:比较 $p=1$ 和 $p=2$ 的结果
参考文献
- Thistlethwaite, D., & Campbell, D. (1960). Regression-discontinuity analysis: An alternative to the ex post facto experiment. Journal of Educational Psychology, 51(6), 309–317.
- Imbens, G., & Lemieux, T. (2008). Regression discontinuity designs: A guide to practice. Journal of Econometrics, 142(2), 615–635.
- Calonico, S., Cattaneo, M. D., & Titiunik, R. (2014). Robust nonparametric confidence intervals for regression-discontinuity designs. Econometrica, 82(6), 2295–2326.
- McCrary, J. (2008). Manipulation of the running variable in the regression discontinuity design: A density test. Journal of Econometrics, 142(2), 698–714.
- Gelman, A., & Imbens, G. (2019). Why high-order polynomials should not be used in regression discontinuity designs. JBES, 37(3), 447–456.
- Cattaneo, M. D., Idrobo, N., & Titiunik, R. (2020). A Practical Introduction to Regression Discontinuity Designs. Cambridge University Press.