计量经济学:异方差、自相关与稳健标准误
1. 问题本质:估计值 vs 推断
很多回归里,系数点估计本身未必错,错的是标准误。
当误差项存在异方差或序列相关时,t 值和 p 值会系统失真。
2. 三类常用稳健标准误
- HC 系列:处理异方差。
- Cluster(聚类)标准误:处理组内相关。
- Newey-West(HAC):处理时间序列中的异方差 + 自相关。
3. Python 示例
import statsmodels.formula.api as smf
res = smf.ols("y ~ treatment + x1 + x2", data=df).fit()
# 1) HC1
res_hc1 = res.get_robustcov_results(cov_type="HC1")
# 2) 按 firm 聚类
res_cluster = res.get_robustcov_results(cov_type="cluster", groups=df["firm_id"])
# 3) Newey-West (HAC)
res_hac = res.get_robustcov_results(cov_type="HAC", maxlags=4)
print(res_hc1.summary())
print(res_cluster.summary())
print(res_hac.summary())
4. 何时用哪一种
- 横截面数据:优先 HC1/HC3。
- 面板数据:优先按个体或政策单元聚类。
- 时间序列:优先 HAC,并报告滞后阶数选择依据。
5. 报告规范建议
- 在表注中明确标准误类型;
- 对关键结论做多标准误对照;
- 若结论只在一种标准误下成立,应降低结论强度。
稳健推断的目标不是“让结果显著”,而是避免把噪声误判为证据。