观察性研究的局限性大样本随机对照研究

2年前 | admin | 281次围观

今天（4月22日）是第45个世界地球日。但比起45年前环境糟糕的美国，包括中国在内的许多发展中国家现在所面临的污染问题，可谓有过之而无不及，其中空气污染更是问题的焦点所在。在中国，雾霾对公众的健康存在多大的影响成为政府与公众共同关注的问题，而他们的双眼，都注视着埋头研究的科学家们。

近日，美国哈佛大学公共卫生学院的弗朗西斯卡·多米尼西（Francesca Dominici）等人在《科学》上发文指出，目前用评估雾霾与人体健康之间的关系，在方法上存在限制。为了使人们更准确地认识大气颗粒物对健康的影响，科学家需要考虑使用“准实验方法”（quasi-experimental雾霾模型预测，QE）进行分析评估[1]。

2003年到2012年，在美国各项重要法规所带来的总收益中，来自于减少空气中悬浮颗粒物（particulate matter，PM）所带来的成效介于总收益的三分之一到二分之一。为降低PM制定的法规具有极大的影响力。然而，PM状况与当地居民健康情况的评估数据是否有效，使用的分析模型是否得当，却是值得重新关注的问题。

观察性研究的局限性

大样本随机对照研究也许是最适合研究PM与健康相关性的方法，但此方法在许多具体问题的研究中可行性并不高。因此，在过去的40年中，美国主要依据观察性研究（Observational Studies）的结果对国家环境空气质量标准进行修订。

在流行病学和统计学中，观察性研究法用于推测某个因素对研究对象的影响。与随机对照研究不同，在观察性研究的分析过程中，研究者不能主动的把样品划分为实验组和对照组。在研究大气颗粒物的健康效应时，观察性研究最终呈现的是在不同时空条件下、在空气污染程度各异的地区居民的健康状况比较。在这种情况下，可能对结果造成影响的各种因素是混杂存在的。如何控制混杂变量的影响，成为观察性研究无法规避的一大挑战。

雾霾模型预测_雾霾预测天气_雾霾模拟实验

空气中总悬浮颗粒物（TSPs）对50岁以上人群死亡率的影响（1969-1974）。第二第三列中不带括号的数值表示每立方米TSP增加1微克导致的每一万个50岁以上当地人群死亡率的增加量。第二列与第三列使用了不同的观察研究处理方法，第二列的评估并没有对混杂变量进行调整。表中的12项观察性研究的回归分析中，有2项得出了TSPs和死亡率之间的显著正相关关系，另外2项却诡异地得出了TSPs和死亡率之间存在显著的负相关关系，剩下的8项则没有得出显著的相关关系。图片来源：Dominici et al.（2014）Science.

在由果壳网承办第38期“科学家与媒体面对面”活动“拨开十面霾伏”中，中国气象科学研究院副院长张小曳指出，雾霾和健康之间的关系需要长期研究，其中变量的复杂性需要被意识到并予以重视。“比方说南方人与北方人基因不一样雾霾模型预测，生活环境不一样，饮食不一样，这些东西都很难被完全剔除掉。”张小曳评论道，“要确定某个病就是因为某个因素造成的，这是个很困难的。”

多米尼西在论文中也提及一项对6座空气污染水平各异的城市进行健康状况分析的研究。他指出，在这类观察性研究中，不同城市居民具有不同的社会经济状态和生活习惯，各地的医疗条件、用水质量也存在差异，人们采取的防护措施等因素在统计数据中也得不到很好地测量——由于许多影响健康的决定因素恰恰是无法被观察到的，采用观察性研究方法得出的结论可能并不能真实有效地反映大气颗粒物和健康之间的关系。

各取所长的准实验方法

那么，怎样才能更准确地评估人体健康与空气污染的关系？研究者推荐了准实验方法。与经典实验一样，准实验评估也需要设计实验组和对照组，并比较分析两者的结果差异。但与经典实验不同的是，准实验所附加的处理因素是研究者所不能控制的，比如如政策、意外事件和监管行为等。

在评估健康与大气颗粒物之间的关系时，准实验致力于将因处理手段的实施而引发的大气颗粒物变化鉴别出来，从而削弱混杂因素或者被忽略的变量所造成的偏差。因此，准实验方法可以被看做兼具随机对照实验和观察性实验特点的研究方法。

近年来，准实验分析方法已被较为广泛的应用。在诸如“每多接受一年高等教育对收入的影响”、“空气污染程度对房价的影响”、“医疗保险对死亡率的影响”等方面的研究中，准实验分析都提供了可靠的评估结果。在研究政策执行对治理大气污染起到的效果及其造成的健康效应方面，采用准实验方法的论文也越来越多，其中就包括2008年北京奥运会举办前、举办时以及举办后治理手段对空气质量的影响，以及我国淮河以北冬季免费提供燃煤供暖政策的作用。

雾霾预测天气_雾霾模型预测_雾霾模拟实验

雾霾中的北京。图片来源：Dominici et al.（2014）Science.

不过，只有满足一定的前提，使用准实验方法才可能得到更可信的评估结果：在使用准实验方法进行研究时，对实验和分析模型的设计要求更加严格，研究者需要使实验组和对照组中可见协变量的值或者影响效果达到同一水平，以排除这些可见协变量对实验结果的干扰。而对于难以观察的协变量，也需先证明其在实验组和对照组中本就十分接近，不会干扰实验结果。

更完善的科研，更准确的传播，更实用的政策

许多研究表明大气颗粒物对人们的健康不利，可能缩短寿命或者增加患病几率。然而，大气颗粒物和健康之间量化的具体关系仍需要进一步确认，降低PM含量所能够带来的具体收益程度也有待更准确的评估。

张小曳说：“我们每天要呼吸上万升的空气，但是多少量的污染物会造成多大程度的危害，科学界现在还没有给出比较确切的结论。”只有获得了这些明确的结果，才能为政策的制定和修改提供可靠的依据。

大洋彼岸的美国在这方面已经开始了较为深入的探索。首先，奥巴马政府开始评估过去的法规，统计其在实践中的具体效果，分析花费高额代价来减少大气颗粒物的成果是否和预期一样显著提高了人民的健康水平，然后以此作为参考调整旧的政策和出台新的政策。

其次，研究人员将通过两个问题进一步明确PM与健康之间的关系：

PM的剂量曲线是什么样的？比如把每立方米空气中的PM从12微克降低到10微克，或者从14微克降低到12微克，哪个对提高健康的收益更大？大气颗粒物的成分很复杂，需要进一步了解PM2.5的成分以及其排放源，明确治理目标，以免增加不必要的治理成本。

上述科学问题的解决，将有助于政府制定更实用的环境政策。而另一方面，在科学家不断努力优化研究方法的同时，作为非科研人员的公众，又能做什么力所能及的事情？“控制雾霾最重要大头、决定性的动作都是政府做的，”张小曳指出，“公众如果能多理解政府的一些行动，比如单双号限行，大家少骂、多理解，做到这点就很不错了。媒体做报道的时候，则要真正比较客观地进行描述,实事求是地把坏的地方、好的地方给大家说清楚。”

雾霾模型预测_雾霾预测天气_雾霾模拟实验

张小曳、黄克武等专家在第38期“科学家与媒体面对面”上阐述雾霾相关问题。图片来源：房瑞标

首都医科大学附属北京朝阳医院呼吸与危重症医学科主任医师黄克武则表示：“就中国而言，我觉得媒体发挥的作用应该是最大的。各种知识的宣传要到位，而且要理性分析。”“媒体可能写的时候为了抓眼球，把一个词改了，原本的意思就完全变了。”他指出，以相关关系和因果关系为例，在科学研究中用什么词进行表述，是非常严格的。

要让政府和公众更好地了解大气污染物对健康的影响，科学家们需要革新分析手段，而媒体则需要准确、严谨地传达科研结果。这样，我们才可以通过最可靠的科学保护人类的健康——一如设立“世界地球日”的初衷。

参考文献：F Dominici, M Greenstone, C R. Sunstein.Particulate Matter Matters. Science. 344, 257-259文章题图：第38期“科学家与媒体面对面”相关拓展阅读果壳相关小组

标签: 对照实验雾霾空气污染科普

观察性研究的局限性大样本随机对照研究

发表评论

作者其它文章

房祖名吸毒牵涉明星柯震东为吸毒公开道歉：我做了最坏的示范

男扮女装明星tfboys 王俊凯女装扮相神似杨幂，TFGir

抑郁症而死的明星这6位患抑郁症离世的明星：李玟让人痛心，张

热门文章

随机文章

最近发表

标签列表

观察性研究的局限性大样本随机对照研究

相关阅读

发表评论

作者其它文章

房祖名吸毒牵涉明星 柯震东为吸毒公开道歉：我做了最坏的示范

男扮女装明星tfboys 王俊凯女装扮相神似杨幂，TFGir

抑郁症而死的明星 这6位患抑郁症离世的明星：李玟让人痛心，张

热门文章

随机文章

最近发表

标签列表

房祖名吸毒牵涉明星柯震东为吸毒公开道歉：我做了最坏的示范

抑郁症而死的明星这6位患抑郁症离世的明星：李玟让人痛心，张