计量经济学：异方差、自相关与稳健标准误

1. 问题本质：估计值 vs 推断

很多回归里，系数点估计本身未必错，错的是标准误。
当误差项存在异方差或序列相关时，t 值和 p 值会系统失真。

2. 三类常用稳健标准误

HC 系列：处理异方差。
Cluster（聚类）标准误：处理组内相关。
Newey-West（HAC）：处理时间序列中的异方差 + 自相关。

3. Python 示例

import statsmodels.formula.api as smf

res = smf.ols("y ~ treatment + x1 + x2", data=df).fit()

# 1) HC1
res_hc1 = res.get_robustcov_results(cov_type="HC1")

# 2) 按 firm 聚类
res_cluster = res.get_robustcov_results(cov_type="cluster", groups=df["firm_id"])

# 3) Newey-West (HAC)
res_hac = res.get_robustcov_results(cov_type="HAC", maxlags=4)

print(res_hc1.summary())
print(res_cluster.summary())
print(res_hac.summary())

4. 何时用哪一种

横截面数据：优先 HC1/HC3。
面板数据：优先按个体或政策单元聚类。
时间序列：优先 HAC，并报告滞后阶数选择依据。

5. 报告规范建议

在表注中明确标准误类型；
对关键结论做多标准误对照；
若结论只在一种标准误下成立，应降低结论强度。

稳健推断的目标不是“让结果显著”，而是避免把噪声误判为证据。