为什么PSM不应用于matching?
我上周和学生讲matching的几种方法,Matching最核心的思想就是在没有随机实验的情况下,人为把观测得到的数据按照受影响(Treatment)和没有受影响(Control)分组,然后将两组里的观测值匹配起来,形成尽可能可以比较的组。
尽可能比较的意思就是:匹配后,两组除了Treatment的差异外,其他特征值组间统计上没有显著的差异。这样就人为构造了统计上无差异可以比较的组。
由此如果两组的结果上有任何显著差异的话,就只可能是Treatment造成的。这样,我们就可以确定treatment对outcomes的影响是causal effects。这里的Treatment可以是一个政策,一个项目,一个干预等等。
最为常见的一种matching手法是propensity score matching (PSM),在Public & Nonprofit Management也有学者使用。当然整体上我们PA领域使用matching方法的毕竟还不是很多,可能是因为我们还不够关心causality的问题。
今天我要介绍一篇Gary King和Richard Nielsen的文章,讲为什么不应该用PSM来匹配。Gary King and Richard Nielsen. 2019. “Why Propensity Scores Should Not Be Used for Matching.” Political Analysis, 27, 4, Pp. 435-454. https://gking.harvard.edu/publications/why-Propensity-Scores-Should-Not-Be-Used-Formatching
结论说在前头,就是以后我们PA领域的学者,也不应该用PSM来做匹配。
为什么呢?
最重要的原因是在如何处理“匹配不上”的observations。一般基于distance的matching方法,例如MDM或者CEM,都会依照各种算法来计算control和treatment观测值之间的距离,然后drop丢弃那些配不上的值。这样哪怕不是完全百分百完美的匹配,总算也是八九不离十。
要么就是类似entropy balancing,算概率进行匹配,不一定需要drop。以上是两种不同的思路。
而PSM是先算概率,这本身并没有问题;但按照概率去配之后返回到原数据,然后是”随机“丢弃观测值。
下面这几张图是我从Gray King的讲座里截出来的,觉得很好可视化了PSM的过程。
我们假定有Age和Education两个维度需要匹配,PSM首先就是根据两个维度来计算一个propensity score,这样就换到了同一个维度上 (图1);
然后根据这个propensity score来配对,最近的放在一起,不需要的就drop掉(图2-3其实是一样的,但我懒得换了,不影响说明);
再接着就是投回去原来的数据(图4,这里其实已经看出问题了,Control-C 与 Treatment-T并没有完全重合,而按照distance matching的话,不重合距离远的应该都已经drop掉了);
最后,我们假设一个最佳案例,在原始数据中CT完全重合(图5)。但PSM投射回去的结果却可能非常biased(图6)。
因为PSM这个”随机丢弃“大有讲究,可能会出现两种情况:一种是随机丢弃的那些值,正好也是按distance匹配后应该丢弃的值,那么PSM的效果应该和MDM或者CEM的效果差不多。
下图中以MDM为例,对比PSM。两者都能有效过滤掉黑色的C观测值,因为都没有办法根据任何一种进行matching。但在蓝色和红色区域的CT匹配上,MDM明显优于PSM,因为PSM是随机丢弃观测值的。
另一种是随机丢弃了那些按照distance匹配本不应该丢弃的值,那么PSM就会比MDM或CEM更糟糕。
下面这张图对比了PSM和MDM的表现。如同上图所示,一开始两者表现差不多,在丢弃黑色C观测值方面都有效。一旦进入到PSM随机丢弃的阶段,其表现就远远不如MDM了。
结合这两种看法,PSM的表现就不如按distance的匹配,在某些情况下如果丢弃了本不应该丢弃的值,还会产生巨大偏差。
下图利用之前的数据,对比了不计算propensity score随机丢弃(Random),PSM,MDM,和CEM的表现,PSM和随机丢弃其实也差不了多少。利用Nielsen等人2011年的数据,发现也就是PSM比随机丢弃好一点,但依旧远远不如CEM和MDM。
所以King和Nielsen认为将PSM从matching家族除名。
特别值得一提的是Nielsen老师。Nielsen老师作为PSM的早期鼓吹者和应用者之一,回头一刀砍了自己过往的成就,真是令人肃然起敬。
学者别说革自己命了,认个错都是很难的。所以在我读完这一篇之后,我觉得King老师固然了不起,但Nielsen老师那才是真英雄。
阅读更多: