计量经济学：面板数据 FE/RE 与 Hausman 检验

1. FE 与 RE 的核心区别

FE（固定效应）：允许个体不随时间变化的不可观测因素与解释变量相关。
RE（随机效应）：要求个体效应与解释变量不相关，条件更强但效率更高。

因此，模型选择本质上是“你是否相信 RE 的外生性前提”。

2. 模型形式

固定效应：

$$ Y_{it}=\alpha_i+\beta X_{it}+\gamma_t+u_{it} $$

随机效应：

$$ Y_{it}=\alpha+\beta X_{it}+c_i+u_{it}, \quad Cov(c_i, X_{it})=0 $$

3. Python 示例

from linearmodels.panel import PanelOLS, RandomEffects

panel = df.set_index(["firm", "year"]).sort_index()

fe = PanelOLS.from_formula(
    "y ~ 1 + x1 + x2 + EntityEffects + TimeEffects",
    data=panel,
).fit(cov_type="clustered", cluster_entity=True)

re = RandomEffects.from_formula(
    "y ~ 1 + x1 + x2",
    data=panel,
).fit(cov_type="robust")

print(fe)
print(re)

4. Hausman 思路

Hausman 检验比较 FE 与 RE 估计差异是否系统性显著。若显著，通常倾向 FE。

实践上，不应机械依赖单一检验：

先做经济学判断（RE 条件是否可信）；
再用 Hausman 作为统计补充；
同时报告 FE 与 RE 的稳健性差异。

5. 结论表达建议

明确“识别依赖的不可观测异质性假设”；
若用 FE，说明无法识别时间不变变量系数；
若用 RE，说明其外生性前提与潜在风险。

模型不是终点，可信识别才是终点。