謝
@豬月邀,別人回答得都挺好的,我就來吐槽一下中國的環境數據吧。
首先中國空氣品質數據大規模采集並開始每日公布始於2000年,當時開始在全國70個大中城市測量PM10,二氧化硫和氮氧化物的每日平均濃度,然後按照一定的方法把這三者的濃度換算成三個指數,指數最高的那個就是當天的API(Air pollution index),這個數據在環保部可以查到。相較於以前而言,這好多了,可還是很差,尤其跟已開發國家比。第一:汙染物仍然不全面,我們現在最關心的PM2.5不在其中,夏季汙染很嚴重的臭氧也不在其中,不過這隨著AQI的推出而改善了。第二:範圍太小,中國不光是70個大中城市,其它地方的空氣品質怎麽辦呢?第三:數據不夠精細。比如說如果我想研究PM10的汙染,對不起沒有數據,只有API指數,即使我知道70%的汙染天都是PM10造成的也沒有意義,因為剩下的30%是二氧化硫和氮氧化物,數據不連續。而且只給我們每天的平均數據,可是早上,中午,晚上汙染可能是不一樣的啊,分時數據環保局是有的,可人家就是不給。第四:極其容易造假。拿上海來說,這麽大的城市絕對不止一個觀測點,以PM10濃度為例,怎麽算呢,可能全市有20個觀測點,那麽環保局就把當天20個點的PM10濃度拿來平均就是今天上海的平均PM10濃度了。但這樣問題就來了,市郊和市區的濃度一樣嗎?離馬路20公尺和馬路邊的點一樣嗎?你布的點科不科學?當然當年環保部反擊美國大使館的PM2.5觀測值的一個依據就是那只是北京一個點,沒有代表性。道理沒錯,可把長安街和懷柔的點一平均就有代表性了?這還算好的,當年政府搞環境考核,有一項叫藍天指數,要求一年API指數在100以下的天數要達到多少,這造成了嚴重的數據造假問題,並且成為了國際環境經濟學界的一個研究熱點問題,感興趣的可以搜搜這篇文章
"Effortless Perfection": Do Chinese Cities Manipulate Air Pollution Data?以及
Gaming in air pollution data? lessons from china為了搞數據,我可以說是絞盡腦汁,當年為了空氣品質數據,我曾經給幾個大城市的環保局發資訊公開函,要求他們公開原始監測站點的分時數據,結果只有上海市一家鳥了我,我說我想研究世博會的空氣品質,人家說原始數據是受保密法保護的,不能給,只能給你每天的三種汙染物的日地區平均濃度數據,還說這是專門為我計算的。從2010-2012年上海每日的PM10,二氧化硫和氮氧化物平均濃度數據,我只能千恩萬謝,可對我而言沒啥大用,因為只有1000多個數據,還是時間序列的,搞過研究的都知道這點數據能幹屁啊。
數據品質對於研究有著非常重要的作用,2015年下半年看到一篇研究,真心牛逼,講的是在美國洛杉磯公路上風向和下風向的疾病死亡率差異,毫無疑問,公路上風向和下風向汙染物濃度是不一樣的,但是我們是察覺不出來的,如果察覺出來路兩邊的房價就應該不一樣,可我們並沒有發現這種現象。那麽這就可以做一個很棒的工具變量來估計大氣汙染對於死亡率的影響,作者的研究表明,每在下風向多暴露一個單位,死亡率就會提高5-6%。這種研究中國是註定沒法做的,因為我們沒有這麽細的數據,路的兩邊都測。而且我個人臆測,即使有觀測點,估計都在馬路上風向幾百米處。文章名叫The effects of long-term exposure to air pollution on mortality
好了,就這樣吧。