当前位置: 华文问答 > 科学

哪里能查到历史的AQI(就是空气质量指数,如PM2.5之类)数据?

2014-05-27科学

之前做过这方面的研究。关于这个问题,真心是比较难查到题主所说的监控点的一手数据的。至少我是没有找到公开数据,推测只能去环保局寻求具体到监控点的一手数据。

分享一下我接触过的几类可以用于空气质量研究的数据。

首先,关于AQI数据,必须明确的一点是AQI(Air Quality Index)和API(Air pollution Index)在国内是不同的数据。两者包含的污染物范围不相同(可能计算方法也有不同?这个我倒是忘记了)。2012年之前的空气污染数据是API。

对于中国,AQI与原来发布的空气污染指数(API)有着很大的区别。AQI分级计算参考的标准是GB 3095-2012【环境空气质量标准】(现行),参与评价的污染物为SO2、NO2、PM10、PM2.5、O3、CO等六项,每小时发布一次;而API分级计算参考的标准是GB 3095-1996【环境空气质量标准】(已作废),评价的污染物仅为SO2、NO2和PM10等三项,每天发布一次。因此,AQI采用的标准更严、污染物指标更多、发布频次更高,其评价结果也将更加接近公众的真实感受。

所以即使AQI和API都是当日首要污染物的反应,但这两者之间做时间序列的分析显然是不能放在一起用的。所以在国内做研究的话,是没有办法在在较长的时间段上运用环保部的数据的。

然后,是几类数据:

1.环保部数据

前面很多答案说环保部数据连北京都没有,只有当日等等等。我还以为只是各位没找到正确的使用方法。去查了一下还真是吃了一惊。至少15年年初还是有的。以下是我在这个网站上抓取的部分原始数据。

不过实际上,这个数据,没有也就没有了。这么恶心的数据没有也罢。估计也是他们自己造假到自己都看不下去了,于是就只能查询当日了吧。呵呵呵呵呵。

至于说这个数据恶心到什么程度呢。负责任的告诉你,他们甚至会作出在月报里把爆表(大于500)的一些日子隐去。如果你足够机智,可以去查一下时报。时报里没有隐去。呵呵,这他妈的逗傻子呢。你星辰大海国中央政府部级机关数据中心竟然能干出这么掩耳盗铃的事来。给谁看,我就想问问你这么藏着给谁看。数据造假比起来都是高端的,他们竟然就能硬生生的把这个数藏起来。你哪怕编上个数呢??!!难道是良心发现??混入敌特了??请原谅我跑题了。只是重新回味了下当时stata里处理的时候发现少几个数时候像吃了屎一样的心情,进而久久难以平静= =

关于AQI数据在数据上的造假问题,也有很多文章讨论过。例如这篇:

Ghanem, D., & Zhang, J. (2014). ‘Effortless perfection:’ Do Chinese cities manipulate air pollution data?.Journal of Environmental Economics and Management,68(2), 203-225.加州大学两位教授直接运用统计学手段展现了中国空气污染数据的造假问题。

所以即使环保部的数据可获得,也不知道是几手的数据了。我接触的老师基本上对这个数据持否定态度,不会在文章里使用这种数据。

前些年还是有不少文章用这个数据发了不错的刊的。而且实际上的确只有环保部有多个监测站的数据。有些政策识别问题上,怎么讲呢,你相信就好。比如:曹静, 王鑫, 钟笑寒. 限行政策是否改善了北京市的空气质量?[J]. 经济学 (季刊), 2014, 3: 1091-1126.

LS很多答案提到了

PM2.5查询|PM2.5历史数据查询|PM2.5全国排名|PM2.5统计分析|PM2.5全国分布图

这个网站。我以前并不知道。看了一下应该是抓取的国控点的数据。感觉应该是很好的一个数据源。不过我还是比较好奇他们的数据是怎么获得的。貌似是来源于这个网站

PM25.in | PM2.5(细颗粒物)及空气质量指数(AQI)实时查询!

而这个网站是怎么获得的监测站数据呢。当然,其实环保部是有发布的,可能这些网站做了汇总统计和记录。

2.NASA AOD(Aerosol Optical Depth)数据

既然直接的AQI数据不好用,那AOD数据,也就是气溶胶光学厚度就是研究的一个很好的数据。

气溶胶 ,又称 气胶 烟雾质 ,是指固体或液体微粒稳定地悬浮于气体介质中形成的分散体系。一般大小在0.01-10微米之间,可分为自然和人类产生两种。气溶胶会影响气候,包括吸收辐射或散射辐射,另外,气溶胶会成为凝结核而影响云的性质等。

而气溶胶光学厚度是描述气溶胶对光的衰减作用的一个数据。NASA数据的网址是

LAADS Web

当然,AOD数据需要转换才能用作大气污染研究。

Gupta P, Christopher S A, Wang J, et al. Satellite remote sensing of particulate matter and air quality assessment over global cities[J]. Atmospheric Environment, 2006, 40(30): 5880-5892.

Kumar N, Chu A D, Foster A D, et al. Satellite remote sensing for developing time and space resolved estimates of ambient particulate in Cleveland, OH[J]. Aerosol Science and Technology, 2011, 45(9): 1090-1108.

这两篇文章都是比较早的运用。

AOD的使用上还是一些问题的。比如AOD数据在比起直接的AQI数据可能受到更大的自然因素的影响,做政策识别时对结果会有一定影响。

在中国的政策识别上,陈老师的这篇文章是一篇比较经典的同时运用了API和AOD数据的文章:

Chen Y, Jin G Z, Kumar N, et al. The promise of Beijing: evaluating the impact of the 2008 Olympic Games on air quality[J]. Journal of Environmental Economics and Management, 2013, 66(3): 424-443.

下图来自陈老师这篇关于奥运会环境规制政策研究的文章。从中可以看出AOD数据比起环保部发布的单个的数值,可以取更多的采样点,更加接近监测站的数据。

这幅图是 July 1, 2000的检测状况。背景网格2.5 km*2.5公里,每一个圆半径5公里,圆心为AOD观测中心点。

3.美使馆数据和很多网站发布的数据。

这些数据是自测数据。在设备可靠地情况下也存在着采集点比较单一的问题。对于北京这么大的城市,其实包括美使馆数据在内的很多单一检测点的数据,在统计意义上还是要打折扣。一般并不适合用来做数据分析。不过类似于美使馆这种连续的定点的数据其实还是可以在一定程度上反映一些问题的。尤其对于日常生活等方面还是比较好用的。