计量经济学:面板数据 FE/RE 与 Hausman 检验
1. FE 与 RE 的核心区别
- FE(固定效应):允许个体不随时间变化的不可观测因素与解释变量相关。
- RE(随机效应):要求个体效应与解释变量不相关,条件更强但效率更高。
因此,模型选择本质上是“你是否相信 RE 的外生性前提”。
2. 模型形式
固定效应:
$$ Y_{it}=\alpha_i+\beta X_{it}+\gamma_t+u_{it} $$
随机效应:
$$ Y_{it}=\alpha+\beta X_{it}+c_i+u_{it}, \quad Cov(c_i, X_{it})=0 $$
3. Python 示例
from linearmodels.panel import PanelOLS, RandomEffects
panel = df.set_index(["firm", "year"]).sort_index()
fe = PanelOLS.from_formula(
"y ~ 1 + x1 + x2 + EntityEffects + TimeEffects",
data=panel,
).fit(cov_type="clustered", cluster_entity=True)
re = RandomEffects.from_formula(
"y ~ 1 + x1 + x2",
data=panel,
).fit(cov_type="robust")
print(fe)
print(re)
4. Hausman 思路
Hausman 检验比较 FE 与 RE 估计差异是否系统性显著。若显著,通常倾向 FE。
实践上,不应机械依赖单一检验:
- 先做经济学判断(RE 条件是否可信);
- 再用 Hausman 作为统计补充;
- 同时报告 FE 与 RE 的稳健性差异。
5. 结论表达建议
- 明确“识别依赖的不可观测异质性假设”;
- 若用 FE,说明无法识别时间不变变量系数;
- 若用 RE,说明其外生性前提与潜在风险。
模型不是终点,可信识别才是终点。