Page QiView

计量经济学:异方差、自相关与稳健标准误

计量经济学:异方差、自相关与稳健标准误

1. 问题本质:估计值 vs 推断

很多回归里,系数点估计本身未必错,错的是标准误。
当误差项存在异方差或序列相关时,t 值和 p 值会系统失真。

2. 三类常用稳健标准误

  • HC 系列:处理异方差。
  • Cluster(聚类)标准误:处理组内相关。
  • Newey-West(HAC):处理时间序列中的异方差 + 自相关。

3. Python 示例

import statsmodels.formula.api as smf

res = smf.ols("y ~ treatment + x1 + x2", data=df).fit()

# 1) HC1
res_hc1 = res.get_robustcov_results(cov_type="HC1")

# 2) 按 firm 聚类
res_cluster = res.get_robustcov_results(cov_type="cluster", groups=df["firm_id"])

# 3) Newey-West (HAC)
res_hac = res.get_robustcov_results(cov_type="HAC", maxlags=4)

print(res_hc1.summary())
print(res_cluster.summary())
print(res_hac.summary())

4. 何时用哪一种

  • 横截面数据:优先 HC1/HC3。
  • 面板数据:优先按个体或政策单元聚类。
  • 时间序列:优先 HAC,并报告滞后阶数选择依据。

5. 报告规范建议

  • 在表注中明确标准误类型;
  • 对关键结论做多标准误对照;
  • 若结论只在一种标准误下成立,应降低结论强度。

稳健推断的目标不是“让结果显著”,而是避免把噪声误判为证据。