• 发表澳门新葡8522最新网站
  • 分享到微信朋友圈
  • 新浪转发


因果推断:利剑和2021诺贝尔经济学奖三剑客的故事

2021年10月12日 14:42 来源于 财新网
可以听文章啦!
卡德虽然是做劳动经济学的,但他用的方法主要是因果推断;而虽然安格里斯特和因本斯的获奖理由主要是因果推断,但他们也都在劳动经济学的问题上有所探究。从这个意义上讲,如果我们说这次诺奖其实就是颁给因果推断的,似乎也没有什么大问题
陈永伟
《比较》研究部主管,北京大学市场与网络经济研究中心的研究员和主任助理。经济学博士,博士后,研究领域为产业经济学,发展经济学和法律经济学,曾在中英文学术期刊上发表论文数十篇。

  【财新网】(专栏作家 陈永伟)北京时间10月11日18点,2021年诺贝尔经济学奖得主揭晓。经济学家戴维?卡德(David Card),约书亚?安格里斯特(Joshua D. Angrist) 和奎多?因本斯(Guido W. Imbens)共同获得这一奖项。和往年惯常的三位获奖者以相同比例分享将奖项不同,根据诺奖评委会的决定,卡德因其“对劳动经济学实证研究性的贡献”而获得了一半的奖项;而安格里斯特和因本斯则因“对因果关系分析的方法学贡献”而分享另一半的奖项。

  不过,虽然诺奖评委会专门区分了三位获奖者的贡献以及获奖比例,但事实上,这“三剑客”的研究是有很多交叉的。卡德虽然是做劳动经济学的,但他用的方法主要是因果推断;而虽然安格里斯特和因本斯的获奖理由主要是因果推断,但他们也都在劳动经济学的问题上有所探究。从这个意义上讲,如果我们说这次诺奖其实就是颁给因果推断的,似乎也没有什么大问题。

  那么,因果推断作为一种计量方法,究竟对经济学有什么重要意义?在现在的经济学领域,究竟有哪些重要的因果推断方法,它们又是如何被应用的?此次获得诺奖的三位究竟在因果推断领域作出了哪些贡献,又会对经济学未来的发展产生怎样的影响?对于所有的这些问题,就让我们慢慢道来吧。

因果研究简史:从亚里士多德到鲁宾

  作为万物的灵长,人类天性当中就包含了对因果关系的好奇。当看到一桩新事物的时候,人们总是会不禁地问:“这东西为什么会这样?它背后的原因到底是什么?”比如,在战国时期著名诗人屈原的长诗《天问》中,就围绕天地万物运行的因果一口气提出了170多个问题。

  在古人看来,因果关系是神圣的,具有极高的价值。据说,曾经有人问过古希腊哲学家德谟克里特,因果关系到底有什么价值,这位哲人的回答是,对他来说,一个因果关系的价值要胜过一个波斯的王位——尽管这个回答是出自一位哲人之口,但它确实也在一定程度上道出了因果关系在人们心中的重要地位。

  由于因果关系对人们来说是如此的重要,因此至少从两千多年前开始,人们就已经开始了对因果问题的相关理论探究。例如,亚里士多德在其著作当中,就曾经提出了著名的“四因说”,把事物的原因分为了“形式因”,“质料因”,“动力因”和“目的因”,并提出了用枚举和归纳来推测因果的操作方法。到了文艺复兴时期,弗朗西斯?培根等学者则开始用归纳法来分析事物的因果。随后,约翰?穆勒则在自己的著作《逻辑体系》(注:中译由严复先生翻译,题目为《穆勒名学》)中对通过归纳确定因果关系的思路进行了详细的论证,并提出了五种分析因果关系的方法。后来,这五种方法被学界统称为称为“穆勒五法”。由于穆勒本人是古典经济学的重要代表人物,因此经济学界或许有权利宣称早在19世纪时,经济学人已经开始了对因果问题的研究。

  不过,和穆勒的讨论相比,现代经济学意义上的因果关系还是有很大不同的。如果说,在穆勒时代,因果推断更多是一种基于哲学的探索,那么现代意义上的因果推断则更多是一种统计上的努力。

  在现代经济学中,曾经有两个和因果相关的理论先后受到了人们的重视:

  前一个理论是所谓的“格兰杰因果”(Granger Causality)理论。这种因果理论关系的是两组时间序列之间的关系。例如,我们观察了几十年的收入和消费数据,发现从收入的变化可以从统计上解释消费的变化,但反过来不行,那我们就可以说收入是消费的原因,但反之不然。需要指出的是,尽管“格兰杰因果”理论帮助其提出者克莱夫?格兰杰(Clive W.J.Granger)斩获了2003年的诺贝尔经济学奖,并且其在现实当中也有很多应用,但关于“格兰杰因果”究竟能不能属于真正意义上的因果关系,学界是一直存在争论的。并且随着计量技术的发展,“格兰杰因果”已经在学界被逐渐边缘化。

  后一个理论则是由统计学家鲁宾(Donald B. Rubin)提出的基于干预效应(Treatment Effect)的因果推断理论。而如果从思想上,这一理论的源头则至少可以追溯到上世纪前半期的著名统计学家耶日?内曼(Jerzy Neyman)。

  1923年,当时还是华沙大学博士生的内曼就对因果问题进行过考虑。在他看来,所谓的因果关系,应该是基于一种“干预”(treatment)进行前后被干预对象表现的差别。比如,一亩地如果不用化肥,可以产五百斤的粮;如果用了化肥,可以产八百斤,那么这中间差的三百斤就是使用化肥这个“干预”所产生的因果效应。不过,这里就产生了一个问题:从理论上讲,要看一个因果关系的大小,就应该看同一亩地在施肥这个现实状态和不施肥这个反事实(counterfactual)状态下的产量对比。但是,一亩地怎么可能比较这两种状态呢?显然这就存在一个悖论。内曼提出的一个方案是,可以用对照试验来解决这个问题。比如,可以找一千亩地,随机地把它们分成两组,把其中的一组视为“干预组”(treatment group),另一组作为“对照组”(control group)。对于“干预组”的地,都施用化肥,而对“对照组”的地,则什么也不做。最后,研究者只需要对比“干预组”和“对照组”的平均亩产量,就可以得到最终的因果效应。

  应该说,内曼的方法是十分有建设性的。事实上,在他的方法提出后,就立即被很多学科采纳了。甚至在一直被认为不能进行实验的经济学领域,也催生出了实验的方法,而采用实验方法的迪芙洛(Esther Duflo)和巴纳吉(Abhijit Banerjee),也已经在几年前获得了诺贝尔经济学奖——关于这段故事,我们在先前的专栏当中已经进行了介绍,在此不再赘述。

  需要说明的是,尽管实验的方法可以在很多条件下帮助我们识别因果效应,但是在很多情况下,实验根本无法进行。比如说,如果我们要分析某种食物的致癌性,那么从理论上讲,最好的办法就是找一个“对照组”和一个“实验组”,让一组人吃这种食物,另一组人则不吃,然后比较这两组人的癌症患病率。但是,除了极少数的科学狂人之外,恐怕没有人会同意这个方案,因为它实在是违背了伦理。换言之,在现实当中,是否接受“干预”很难是一个随机现象。在这种条件下,直接比较两组人的表现就不再能直接表达出因果效应。以吸烟和癌症为例,有一种理论就认为,有些人之所以爱吸烟,就是因为含有某种基因,而这种基因本身就能让人更容易得癌症。因此,表面上看起来的吸烟导致的高致癌率,其实是因为这种基因所引起的。

  基于以上原因,鲁宾在分析因果问题的时候,并没有沿用内曼所建议的实验方法。不过,他保留了内曼关于因果效应的定义,认为它应该被定义为“干预”之后的实际状态与没有进行“干预”的“反事实”状态之间的区别。那么,怎么样才能计算出这两个状态之间的差别呢?他给出的方案是,如果可以创造一种环境,在控制一些因素后,让是否接受“干预”可以成为一种随机的事件,那么就可以通过比较接受“干预组”的平均表现和“对照组”的平均表现来获得因果效应了。或者更为通俗地说,尽管在现实当中,有时候我们没法进行实验,但是如果可以设法模拟出一个类似的随机试验环境,那么内曼的结论就依然是适用的。比如,如果我们可以找到两组人,通过一定的分析,认定他们从事前看选择吸烟和不吸烟的概率是相同的,那么我们就可以通过比较这两组人的癌症发病率来推断因果效应了。

  鲁宾的因果推断框架一经提出,就立即引起了很多学科的重视。而经济学界显然是受到其影响最深的领域之一。在鲁宾之后,“因果推断”开始逐渐占领了经济学专业杂志,随后又开始逐渐占领了教科书,进而成为了显学。

因果推断的“五把剑”

  现在鲁宾已经为因果推断的研究提供了必要的概念和框架,剩下的问题就是如何才能将这个框架进行应用。换言之,就是如何去创造一个“干预组”和“干预组”独立于其他各种因素的环境。从现有的文献看,目前经济学家们比较常用的方法主要有五种:

  第一种是“倾向性得分匹配”(propensity score matching)。这种方法的提出者,就是鲁宾和他的合作者保罗?罗森鲍姆(Paul Rosenbaum)。

  这种方法的思路很简单,就是如前面说的,直接从“干预组”和“对照组”当中找出两组人来,保证他们事前选择是否接受干预的概率相同,然后对其表现进行比较。

  具体来说,我们可以考虑两组人的各种特征对于是否接受“干预”的影响。比如,一个人是不是抽烟会取决于很多因素,例如年龄,性别,财富,地位,工作等大量因素都会影响抽烟的概率。利用统计学的方法,我们可以把每种因素的影响大小计算出来,最后就可以计算出每个人吸烟的概率。随后,我们就可以把“干预组”和“对照组”当中概率近似的人分别拉在一起进行比较。比如,在两组人当中,都有一部分人从事前看有70%的概率可能吸烟,从事后看,确实吸了烟的人癌症患病率是3%,而没有吸烟的人的患病率是1%,那么这一批人当中,吸烟对癌症发病率的因果作用就是2%。研究者可以重复以上过程,把所有概率的人都进行一个对比,得到很多组差值,最后把这些差值进行平均,就得到了我们所要的因果效应。

  第二种方法是回归分析(Regression Analysis)。如果要详细考察回归的历史,我们至少可以追溯到达尔文的那位表弟高尔顿。事实上,正是一些甚至不被他自己看好的研究催生了现代统计学中的一个重要工具——回归。

  要用纯文字介绍回归并不很容易,但大致上讲,它可以被描述为一个求解条件均值的问题。举例来说,假如我们要对一个地区的房产价格及其影响进行分析。影响房产的因素很多,地段,楼层,户型,面积都会影响房价。但作为研究者,我们希望确切地知道,如果给定其他因素不变,其中的每一个因素究竟是怎么影响房价的。或者更为具体的说,我们希望把房价表示成一个由各种因素影响的公式,在每个因素前面,都有一个数字,它们都可以表示给定其他因素不变,这个因素对于房价的影响大小。得到这个公式的步骤,就是回归。

  在统计当中,实现回归的方法很多,最常见的就是所谓的“最小二乘法”。很显然,如果我们所考虑的每一个因素都是一个外生给定的量,而不受其他隐藏条件的影响,那么回归就可以很好地控制那些无关紧要的因素,通过观察我们关注的因素前面的系数,就可以得到鲁宾意义上的因果效应。

  第三种方法是所谓的“工具变量法”(Instrumental Variable Method)。这种方法是用来干预所谓的“内生性”(endogeneity)问题的。

  如前所述,在鲁宾的分析框架当中,要求在控制了各种变量后,“干预组”和“对照组”在事前接受干预的概率是相同的。但在现实当中,干预变量很可能受到某些不能观察的因素的影响,因而即使控制了所有可以观察的变量,我们也很难构造出一个鲁宾模型所要求的那个条件。这时,我们就可以引入工具变量来进行干预。

  举个最简单的例子,需求曲线可能是经济学家最为津津乐道的模型了。需求曲线是一个再简单不过的模型,它只是需求量和意愿支付价格之间的关系,而一旦有了这个模型,经济学家们就可以各种“一顿操作猛如虎”,得到很多结论。但是,问题在于有人能确切说出一个市场上的需求曲线是什么样的吗?有人可能说,这个不难啊,我们不是有市场的历史数据吗?把所有时期的数据找来,看一下每一个时期价格和市场销量的关系,用回归得到一个公式不就行了吗?但这显然是有问题的。原因很简单,在现实当中,我们看到的每个时期的销量都是供给和需求共同作用的结果,因此,我们就很难简单地把市场上的销量视为需求量。为了要把需求分离出来,我们就必须要分离出供给的影响。

  那么,怎么从市场的销量当中分析出供给的影响呢?一个方法,就是寻找一个只会影响供给,而不会影响其他因素的变量,用它的变化来推测供给的变化。比如,在渔业市场上,鱼的供给量是和天气密切相关的,因此我们就可以通过统计来得到这种关系。如果我们知道了每一个历史时刻的天气状况,就可以推测出每一个时间的供给曲线。如果我们熟悉供给模型,就可以知道,随着供给曲线的外生移动,它会和需求曲线交出一个个的点,而通过这些点,我们就可以识别出需求曲线中价格和需求量之间的关系,而借助这个模型,就可以知道每一单位需求量对于消费者意愿支付的因果影响。在这个例子中,天气只会通过供给来影响销量,因此它就是本模型当中的一个工具变量。工具变量是来自于原模型之外的,但借助它,我们就可以看清模型内部的关系。

  值得一提的是,在所有常用的因果推断方法中,工具变量法可能是唯一一个由经济学家原创的。之所以说是“可能”,这个方法的提出者据说是一位名不见经传的经济学家菲利普?莱特(Philip Wright),他研究的是植物油的关税这样一个小众的领域。而碰巧的是,他的儿子斯威尔?莱特(Swell Wright)却是一位鼎鼎大名的统计学家,所以究竟这个方法是父子两人中的哪一个提出的,本身就成了一桩悬案。据说,最近有一些文献计量学家们通过研究表明,菲利普?莱特是提出者的可能性更大。如果这个结论为真,那么经济学家就多少可以松一口气,不至于在高举“经济学帝国主义”大旗的同时,惊讶地发现自己才是完全被别的学科殖了民。

  第四种方法是所谓的“倍差法”,或者“双重差分法”(Difference in Differences Method)。从某种意义上讲,这种方法其实是对控制实验法的一种拓展。如前所述,如果要想从一个控制实验当中识别出因果关系,那么就需要保证“干预”选取的随机性,也就是要让“干预组”和“对照组”的表现在事先是没有差异的。但是,在现实中,干预很难做到这么随机,“干预组”和“对照组”的事先表现总会有一定的差异。在这种情况下,怎么识别因果关系呢?一个办法就是,分别记录下干预发生前后“干预组”和“对照组”的两次差值,然后用干预后的差减去干预前的差。如果在干预前后,这两组对象之间差值的变化仅仅来自于干预活动的话,那么这个“差值的差”就是干预所带来的因果效应。

  最早发现并应用“倍差法”的是公共卫生学家。早在19世纪,英国的公共卫生学家约翰?斯诺(John Snow)就用这个方法研究了饮水质量和霍乱之间的关系。当时,他猜测饮用水的不清洁很可能是导致霍乱的一个重要原因,但却很难找到证据。巧的是,一个“自然实验”的发生为他研究这个问题创造了条件。当时,伦敦的饮用水是由两个水厂供应的,而其中的一个水厂正好发生了搬迁,从一个水质较差的地区搬到了一个水质较好的地区。斯诺就利用这个自然实验的机会,记录下了搬迁前后两个水厂供水地区的霍乱发生率,并计算了相应的双重差分。通过分析,他就得到了水质和霍乱发生率之间的因果关系。

  第五种方法是所谓的“断点回归设计”(Regression Discontinuity Design)。这个方法最早是由心理学家坎贝尔(Donald T. Campbell)和西斯尔维特(Donald Thistlewaite)共同提出的。这个方法的要义是:一个干预的发生与否,是和某一个指标的断点相关的。这时,我们只需要比较一下这个断点两边对象的相关表现就可以得到因果关系。

  例如,我们是不是能上大学,能不能上重点大学,主要就是看分数。假设在某一年,高考录取线是500分,那么这个分数之上的人就可以上大学,而低于这个分数的就不能上大学。但是,我们知道在现实中,高考分数是有很强的随机性的,考501分的人和考499分的人,水平很可能是难分伯仲的。因此,把断点两边的人对照起来看,我们就创造了一个近似的控制实验环境。如果我们对上大学的教育回报率感兴趣的话,只要比较一下这两个群体的人的收入,就可以找到答案了。

  好了,有了倾向性得分匹配,回归,工具变量法,倍差法,以及断点回归设计这五把“利剑”,经济学家们就可以在实践当中将鲁宾的因果推断框架切实落地了。而在应用和发展这些工具的经济学家当中,这次斩获诺奖的“三剑客”毫无疑问都是其中的佼佼者。

  推荐进入财新数据库,可随时查阅宏观经济,股票债券,公司人物,财经数据尽在掌握。

责任编辑:张帆 | 版面编辑:沈昕琪

财新微信

热词推荐
陈小鲁 高澜股份 人工心脏 sdr 国家统计局数据库 华润银行 资本充足率 银河证券 无线输电 陈小鲁 雷洋案尸检 中央军事委员会 历届中央政治常委 德国商务签证 中央政治局
Baidu