证据究竟说了什么?

西班牙 地球上最富有的帝国 450 年
450 年
约 1500 年代 · 帝国巅峰 1964 年 · 已发展
韩国 人均 1,038 美元 35 年
35 年
1953 年 · 教育决策 1987 年 · 已发展

西班牙拥有财富。韩国选择了教育。
将两者区别开来的,是各自向孩子的十八年里装进了什么。

185 个国家 · 140 年的数据

发现 1

这件事已经为 80% 的人类发生

如今已有 154 个国家的每位妇女生育孩子数更少、寿命更长,超过了 1960 年的美国水平。这不是一个理论,而是一项已完成的事实。

80%
的人类已跨越门槛
154
个国家已发展
20%
仍未跨越 — 主要集中在撒哈拉以南非洲,加上巴基斯坦、阿富汗、也门
处于已发展国家(每位妇女生育少于 3.65 个孩子、预期寿命高于 69.8 岁——以 1960 年美国为基准)的世界人口累计占比

1960 年至 1993 年的缓慢攀升,是各国逐步扩大教育的体现。1994 年的垂直跳跃来自中国——经过三十年的教育扩张后,它同时跨越了两个基准。到 2001 年,半数人类已跨越门槛。剩余 20% 集中在撒哈拉以南非洲,最大的例外是巴基斯坦、阿富汗和也门。

发现 2

教育预测未来。收入不能。

收入看似能预测发展,是因为教育驱动了收入。一旦剔除教育的贡献,收入便无法预测任何结果——在每一项检验过的发展产出上都是如此。

检验方式:取每个国家的收入,剔除其中可由教育解释的部分,用剩余部分去预测 25 年后的发展产出。如果收入本身有作用,剩余部分仍应具备预测力。事实上并没有。

向前推一代,什么能预测发展?
各自解释了多少变异?(收入是在剔除教育的贡献之后衡量的)
预期
寿命
47%
教育
0.2%
收入
每位妇女
的孩子数
48%
教育
0.0%
收入
下一代
教育
52%
教育
0.5%
收入
儿童
存活
28%
教育
1.9%
收入

每个国家仅与自身的历史比较,130 多个国家,1960–2015 年。收入是在剔除教育的贡献之后衡量的。
收入的数值如此微小,几乎等同于零 — 没有任何有意义的预测力。

这些数字来自将每个国家与其自身的历史进行比较 — 而非将富国与穷国相比。该方法控制了一个国家所有恒定的因素:地理、文化、殖民历史、制度。剩下的是随时间发生的变化。而这种变化由教育驱动。

收入看似重要,是因为教育让国家变得富裕。但收入中与教育毫无关系的部分,对每一项发展产出 — 预期寿命、生育率、下一代教育、儿童存活 — 都只能解释不到 2% 的变异。收入是下游结果。教育是必要且充分的。

这在每一个教育层级(小学、初中、高中)、每一个时间滞后(15 至 30 年),以及特定考察女孩教育时都成立。受教育的母亲是比人口平均水平更强的预测变量 — 机制通过家庭运作,而非经济。

发现 3

教育的影响跨越世代。收入则不能。

每个变量能预测多远的未来?教育的信号跨越 100 年——四代人——依然存在。收入则在 25 年内消退。

教育 vs 收入:跨世代的预测力
不同滞后长度下的标准化回归系数,四项发展产出
教育 vs 收入在不同滞后长度下的预测力,分别针对预期寿命、生育率、儿童死亡率和下一代教育。教育的信号跨越 100 年依然存在;收入在 25 年内消退。

衰减是平滑的——并非每隔 25 年一个台阶——因为真实人口具有连续的年龄结构。任何时刻,人口中都包含各个年龄段的人。教育以一波又一波完成学业的同龄群方式进入人口,而产生发展产出的家庭决策由成年人在其全部生命周期中行使。这条平滑曲线是连续代际过程的特征,而不是一次离散的 25 年脉冲。

人口代谢(demographic metabolism)是其专业名称(Lutz 2013):受过更多教育的同龄群以一代一次替代的速率取代受过更少教育的同龄群。这是政策账本上最慢的变量。一个国家拥有的其他每一根杠杆 — 制度、市场、监管、财政规则 — 运作速度都比教育更快。它们都不能替代正在通过学校的同龄群。这种不对称正是教育成为一国发展轨迹限制因素的原因:规则错了,明年可以纠正;学校教育的决策错了,损失的就是一代人。

约 1960 年之前,国与国之间的收入差距并不大 — 几乎所有人每年人均收入大致在 400 至 600 美元之间。没有隐藏的收入信号可供挖掘。但教育确有差异:一些国家已经修建学校长达数百年。1915 年一位高祖父母的学业完成情况,仍能预测 2015 年其玄孙辈的儿童存活产出 — 跨越一个世纪、经历三个中间代际的家庭。

如果收入是预期寿命的原因,其预测力应在更长滞后下保持 — 就像教育那样。然而它立即消退。收入在当下与预期寿命同步移动,但并不导致它。教育才是原因。

发现 4

教育从不倒退

在每个国家、每个时期,孩子所受的教育至少不亚于父母。积累在复利增长,从不折旧。

这并非一种统计规律 — 它反映的是生物学。人类拥有任何物种中最长的童年:大约 18 年从父母身上学习。受教育的父母把自己所知传给孩子。这种传递嵌于亲子关系之中,而非政府预算或制度之中。你无法通过削减预算或经济崩溃将它夺走。

在仍在扩大教育的国家里,每一代不仅与上一代持平 — 而是超越上一代。父母教育低于 20% 时,父母每一个百分点的教育会在下一代中产生2.9 个百分点的提升。国家在家庭传递之上又扩展了覆盖范围。

教育跨世代放大
在天花板以下,父母每提升一个百分点的教育,会在下一代中产生超过一个百分点的提升
低于 20% 父母代教育 2.9× 放大倍数 低于 50% 父母代教育 1.8× 放大倍数 低于 90% 父母代教育 1.2× 放大倍数 随着国家接近普及教育,倍数趋近于 1.0(天花板效应) 机制并未减弱 — 而是任务已完成。

如果教育只是自行向上漂移,每一代将与上一代持平 — 而不会超越。放大倍数会是 1.0 或更低。事实上它是 2.9。有某种力量在主动地把它推得更高:在父母传递之上,国家在修建学校。

发现 5

碰撞测试:收入被一夜抹去,教育毫发无损

1997–98 年的亚洲金融危机一夜之间抹去了五个国家的收入。教育发生了什么?什么都没有。它继续向前。

印度尼西亚
−14.5%
收入崩塌
+5.4pp
教育提升
泰国
−8.8%
收入崩塌
+13.4pp
教育提升(加速)
马来西亚
−9.6%
收入崩塌
+1.5pp
教育提升(接近天花板)
菲律宾
−3.0%
收入崩塌
+4.9pp
教育提升
韩国
−5.6%
收入崩塌
+0.2pp
已达 99%(天花板)

这是数据中最清晰的收入剔除测试。收入被骤然抹去 — 不是渐进的,也不是出于政策选择。教育在每个层级都未受影响:初中、高中和大学。泰国实际上还在危机期间加速了

为什么?因为教育被承载在人身上,而不是储存在预算中。一场经济危机可以掏空一个银行账户。它无法把一个母亲的教育抹去。

发现 6

决定性测试:剔除每个变量会发生什么?

若某事物确为原因,剔除它应使结果破裂。若它不是原因,剔除它应使结果完好无损。

剔除收入

仍然成立
孟加拉国在人均 1,159 美元时就跨越了两个基准。韩国在富裕之前就完成了发展。亚洲金融危机抹去了收入;教育毫发无损。

剔除政府提供

仍然成立
韩国和台湾在福利国家很小的情况下完成了发展。机制运作于家庭之中,而非国家预算。

剔除教育

一切都崩塌
柬埔寨在红色高棉时期失去了受教育人口。它花了整整一代人才恢复过来。南非在种族隔离时期蓄意压制了多数人的教育 — 发展因此停滞了几十年。

剔除安全

仍然成立
斯里兰卡 26 年的内战放慢但没有摧毁其教育基础。缅甸 73 年的军政统治也未能阻止发展产出按计划改善。

这种不对称是结构性的:收入储存在银行中,可以被抹去。政府项目依赖预算,可以被削减。教育储存在人身上。你拿不走它。

稳健性说明

唯一一处数据分歧,以及机制对它的回答

两套独立重构的历史教育数据(维也纳人口与全球人力资本数据中心 (WCDE) v3 与 Barro-Lee v3.0)在 185 国面板中除十五个国家外完全一致——那十五个就是苏联加盟共和国。WCDE 报告哈萨克斯坦 1970 年的初中完成率为 94%;Barro-Lee 报告 49%。拉脱维亚 99% 对 57%。俄罗斯 95% 对 73%。差距平均约 40 个百分点,方向完全一致。

按照本文的机制,初中完成率达 95% 的国家应在一代之内产生与西班牙难以区分的生育轨迹,以及与韩国难以区分的儿童死亡率轨迹。苏联加盟共和国都没有。中亚的总和生育率轨迹与伊朗、土耳其重叠了六十年。到 2010 年,伊朗的五岁以下死亡率已反超哈萨克斯坦 — 而伊朗 1970 年报告的初中完成率仅为 22%,哈萨克斯坦为 94%。如果该差距真实存在,这种反超就不可能发生。

异常之处并非社会主义本身:华沙条约国家与南斯拉夫(使用各自的国家统计局数据)在 Barro-Lee 下都通过了表型一致性检验。问题特定于苏联国家统计局 (Goskomstat) — 一个统计机构、一个时代、十五个国家。

研究设计已将其屏蔽。本文的主回归在扩展子面板上估计 — 即子代初中完成率处于积极转型窗口 [10%, 90%] 的国家-年份样本,这是机制实际运作的范围。到 1975 年,十五个苏联加盟共和国已报告完成率高于 90% 的天花板,根据样本构造已被排除在外。父母代教育系数(β = 0.740,n = 1,069,148 个国家,组内 R² = 0.617)无论是否标记这十五国都完全一致:Δβ = 0.000。无论 Goskomstat 在 1960–90 年间多报了什么,都无法通过回归样本影响主结果。

与 Hanushek 的调和。苏联案例的另一作用,是识别考试分数指标的来源。将 Hanushek 当今 15 岁少年的 HLO(哈努谢克学习成果)分数与其父母 25 年前的初中完成率回归,在 77 个国家上得 R²=0.52。R² 对教育的峰值并不出现在零滞后(当今的学校),而出现在 10–25 年滞后(父母一代)。在 60 年滞后(曾祖父母代),R² 仍为 0.49。Hanushek 的考试分数并不是另一种理论框架。它们正是本文的完成率指标,经过三代家庭生态位传递后的积分。

哈努谢克竞速回归的拆解恰如生物学所预测:小学完成率的"量"驱动 TFR(β_z=−0.64,t=−7.4);组合堆叠的"质"(细菌学说 + 剂量反应 + 卫生链条)驱动五岁以下死亡率(β_z=−0.70,t=−7.6)与预期寿命(β_z=+0.83,t=+7.7)。生育率是一种门槛决策,运行在堆叠的最底层级,即便学校教育很浅也能登记到效果。儿童存活与成人寿命则需要组合堆叠,在文凭空洞之处不会有反应。空洞教育不是教育,但暴露对 TFR 仍然有作用。

完整讨论:参见《漫长的童年:论人类的趋同》中的「空洞教育」一章(苏联异常案例所检验的)。分析脚本:ussr_exclusion_panel.pywhich_edu_measure_is_correct.pyhanushek_horse_race_comprehensive.pyhlo_vs_education_lag_sweep.py

运作机制

用一段话概括的机制

国家教育第一代。受教育的母亲生孩子更少,且几乎所有孩子都能存活下来。孩子更少意味着每个孩子分到更多资源。更多资源意味着更多教育。受教育的父母送孩子上学 — 这一过程从此自我延续。国家创造教育;家庭使其永久。健康、收入、生育率下降以及女性赋权都是下游效应 — 它们是受教育的人通过数以百万计的家庭决策产生的结果,大约在教育发生之后 25 年。

证据已足够。决定不可推迟。