-
近年来,灰霾天气频发,环境质量不断恶化,PM2.5污染成为公众关心的重点问题,也成为引起上海市环境质量恶化的主要污染物之一[1]. PM2.5不仅对环境质量有负面影响,同时容易进入人体内通过血液循环的方式损害人体健康,因此减少颗粒物的排放对于人类生活和社会环境都有重要意义[2-5].目前,世界上大多数国家都制定了PM2.5的排放标准,我国现行的PM2.5排放标准是二级,年均值为35 μg/m3,日均值为75 μg/m3,上海市PM2.5浓度大多数情况下均高于标准值.为有效控制PM2.5扩散造成的影响,了解PM2.5的污染特征及其与空气中的PM10、CO、NO2、SO2和O3之间的相关性对细颗粒物的控制和防治均有重要意义.
为了有效地控制污染物排放提高空气质量,很多学者对PM2.5的污染特征和与其他污染物的相关性进行了大量研究.黄鹂鸣等[6]研究南京市空气中PM2.5占PM10的比例为68%,空气污染以细颗粒物污染为主;罗岳平等[7]研究长株潭地区环境空气中PM2.5与O3之间的关系,得出二者不叠加污染,夏秋两季应加强O3污染的防治,冬季主要预防PM2.5污染的结论;佘日新[8]对比了泉州市区与郊区的PM2.5、PM10污染水平与相关性,城区颗粒物浓度明显高于郊区,城区与近郊区的PM2.5与PM10具有明显的相关性和月变化特征,颗粒物最高浓度出现在1月,最低浓度在2月和7月出现;王菊等[9]对长春市空气中TSP、PM2.5和PM10进行相关性研究,三者在空气污染中具有相似的变化规律和同源性,可以通过TSP和PM10进一步估算PM2.5的浓度;Wang等[10]研究了上海市不同功能区PM2.5和PM10的来源,PM10和PM2.5的浓度在冬季最大,夏季最低,PM2.5和PM10受地面扬尘和交通污染影响严重;Zhang等[11]对中国深圳地区的PM2.5分布和来源进行了分析,结果表明PM2.5是深圳地区的主要污染物,空气中PM2.5和PM10很高,郊区的PM2.5浓度低于市区,西部地区颗粒物浓度均高于东部地区.
本文对上海市PM2.5的污染行为及其与PM10、CO、NO2、SO2和O3的相关性进行研究,利用主成分分析和污染物间相关系数分析空气中污染物之间的相关性,利用逐步回归的方法建立PM2.5与PM10、CO、NO2、SO2和O3的回归模型,进一步研究PM10、CO、NO2、SO2和O3对PM2.5的影响,为明确不同区域的污染物污染行为和变化特征,从源头上控制PM2.5的排放以改善空气环境质量提出科学可行的治理方案提供依据.
全文HTML
-
选取徐汇上师大和浦东川沙两个监测点分别代表市区和郊区,研究不同的时间和空间市区和郊区大气中污染物PM2.5的行为特征、区域分布特征,分析PM2.5和其他污染物之间的相关性.在本研究中所使用的数据是徐汇上师大和浦东川沙监测站自2014年4月14日至2015年3月24日PM2.5、PM10、CO、NO2、SO2和O3的每小时原始污染数据.
-
一般来说,利用主成分分析的方法时,第一主成分解释了样本数据大部分的方差,第一个占有比例最大就是主要成分[12].为了更好阐明主成分中每个原始变量的影响,会使用一些其它的算法如方差极大旋转算法,通常是利用因子载荷表示每个变量的贡献到一个特定的成分.方差极大旋转法只能最大限度地确保每个变量与某一个主成分相关性最强而与其他成分之间的相关性几乎接近于零[13].本文中使用的方法是优化空间模式并删除污染物之间可能隐含的多重共线性.
主成分分析的主要结果是因子载荷,它能够反映变量对特定主成分的贡献率是多少,以及一个变量与另一个变量的相似度[14].变量的载荷越高,说明该变量对某特定成分的贡献越大.本文利用SPSS 19对空气中的6种污染物进行了主成分分析(PCA).
-
逐步回归是通过引入多个自变量,根据它们对因变量的贡献来不断剔除自变量,建立最佳回归模型[15].在每次剔除掉某个自变量后,都需要进行一次F检验和t检验,以确保保留的自变量对因变量有很大的贡献[16],逐步回归的优点是可以通过连续过滤有效地消除具有多重共线性的变量.
逐步回归的基本模型为
其中,Y是因变量(输出值),X1…Xn是自变量(输入值),β0是常系数,β1…βn是回归系数,ε是均值为0方差为σ2(σ>0)的随机变量.本文以matlab为分析工具建立分析空气中PM10、CO、NO2、SO2和O3对PM2.5的逐步回归模型.
1.1. 数据来源
1.2. 主成分分析(PCA)
1.3. 逐步回归
-
对全年的PM2.5有效数据进行整理,分析徐汇上师大和浦东川沙两个功能区的PM2.5污染水平如表 1所示[17].表中两个监测站点均出现颗粒物浓度超标的情况,徐汇上师大和浦东川沙的PM2.5年平均浓度分别为55.66±42.36 (μg/m3)和47.54±42.51 (μg/m3),变异系数分别为89%和76%,浦东川沙地区PM2.5浓度及变异系数均小于徐汇上师大,徐汇上师大和浦东川沙地区的PM2.5污染超标率分别为25%和20%,结合以上数据可见徐汇上师大地区的PM2.5污染情况较浦东川沙地区严重,其原因可能与市区频繁的车流量和人流量以及繁华商业区有关.为改进市区的污染状况,建议控制车流量和减少商业区污染物的排放.
-
表 2是徐汇上师大和浦东川沙监测站对PM2.5、PM10、CO、NO2、SO2和O3 6种污染物进行主成分分析的结果.根据下表可以看出,徐汇上师大的4个主成分总共解释了82.95%的方差,浦东川沙的4个主成分总共解释了85.14%的方差.对于徐汇上师大,第一主成分主要贡献于PM2.5和PM10,第二主成分对O3有重要贡献,第三主成分对CO有重要贡献,第四主成分对SO2贡献最大.对于浦东川沙而言,第一主成分也是主要解释了PM2.5和PM10,第二、三、四主成分都有各自对应的解释对象.根据主成分分析的结果,笔者得出在6种污染物中,PM2.5和PM10具有最强的相关性,这和它们相似的形成原因和存在形态有重要关系.
-
根据主成分分析的结果,两个监测站的PM2.5和PM10均由第一个主成分解释,所以PM2.5与PM10的相关性较其他污染物强.因此,以下对PM2.5和PM10的污染浓度变化特征进行分析.
-
图 2展示了市区和郊区PM2.5和PM10的月变化情况,3、4、5月为春季,6、7、8月为夏季,9、10、11月为秋季,12、1、2月为冬季.根据图形变化情况,可以得出全年市区和郊区的PM2.5和PM10呈现U形变化趋势,即夏秋季颗粒物浓度低,冬春两季颗粒物浓度高.呈现这种季节性变化与上海市的气象因素有关,夏秋季上海盛行东南风,受海上清洁空气影响,颗粒物易分解和扩散,颗粒物浓度低,冬季上海盛行西北风,冷空气带来内陆污染团从而颗粒物浓度上升[1].春天植物开始生长,一方面降低了风速阻碍颗粒物的扩散,另一方面植物叶面吸收颗粒物,对降低颗粒物浓度有积极作用,从而出现春季颗粒物浓度低于冬季的现象[6].
PM2.5/PM10也是衡量颗粒物污染水平和特征的重要指标.从图 2可以看出,PM2.5/PM10在不同季节的波动性较大,不同季节颗粒物粒径分布特征存在差异[18].各区域的PM2.5/PM10在50%~90%之间,PM2.5占PM10的比例很高,主要污染物为PM2.5,这与陈林等人对重庆地区的研究结果相似[19].对比市区和郊区的PM2.5/PM10变化情况,冬春两季该比率较夏秋季高,北方地区取暖产生的颗粒物随盛行的西北风扩散到上海,造成空气中细颗粒物浓度升高[20].市区PM2.5/PM10的最高值出现在7月份为85%,与空气中高的PM2.5浓度及大量车流量和夏季二次粒子生成有关;郊区PM2.5/PM10最高值为88%出现在6月份,高温会促进空气中的大颗粒物分解[21].研究表明:颗粒物的粒径分布特征在一定程度上与监测点周边的污染源及气象因素有关.
-
图 3给出了徐汇上师大和浦东川沙PM2.5和PM10浓度的日变化情况.从图中可以看出郊区PM2.5和PM10的日平均浓度均比市区低,但两个区域的颗粒物都呈现双峰型的变化趋势,在早上(8:00-10:00)和晚上(18:00-21:00)达峰值,由于这段时间人类活动增多,以及车流量和商业活动的共同作用导致污染物排放增多从而引起颗粒物浓度上升.晚间(22:00-5:00)进入休息时段,外界活动减少,气温降低引起颗粒物沉降,空气中PM2.5浓度降低.中午(11:00-16:00)气温升高,颗粒物开始扩散造成浓度降低.
分析两个地区的PM2.5/PM10的日变化情况,市区和郊区的PM2.5/PM10日变化存在相似性,即一天中峰值都出现在早晨4:00-7:00,最低值则在晚间出现.早晨时段温度低,空气中的粗颗粒物受低温影响凝聚沉降,同时人类日常活动开始,居民做饭及车流量排放的细小污染物增多,细颗粒物浓度上升,占PM10的比重加大.川沙地区的PM2.5/PM10在下午时段16:00-19:00达到最低,而徐汇地区的PM2.5/PM10在晚间17:00-23:00达到最低.川沙地区和徐汇地区的PM2.5/PM10最低值均在晚间出现,相比白天时段PM2.5/PM10值更低,分析其原因为晚上的地面温度低于空气温度,温度翻转导致稳定的大气条件阻止垂直气流,有利于粗颗粒物的沉积和细颗粒物的积聚.
-
表 3为PM2.5与PM10、CO、NO2、SO2和O3之间的相关关系. PM2.5与O3之间成负相关关系,这是由于O3与空气中的PM2.5有拮抗反应,能通过光化学反应消耗空气中的PM2.5[7].而PM2.5与PM10、CO、NO2和SO2之间则呈明显的正相关关系,说明这5种污染物对PM2.5浓度的增加有促进作用.在6种污染物中,PM2.5与PM10的相关系数最高,徐汇上师大为0.90,浦东川沙为0.91,主要原因为PM2.5是PM10的组成部分,两者都以颗粒物形态存在,且形成原因相似,导致它们间的相关系数较PM2.5与其他污染物高.
相关系数结果表明,PM2.5与空气中其他污染物间存在相关性,为分析其他污染物是如何影响PM2.5的,利用逐步回归的方法对PM2.5浓度进行预测.以PM10、SO2、CO、NO2和O3为输入变量,PM2.5为输出变量,并以相关系数(R)和均方根误差(RMSE)为评价参数对回归模型进行评估.相关系数(R)越大,均方根误差(RMSE)越小说明预测结果更准确,相应污染物对PM2.5浓度的影响亦越大.在利用逐步回归的方法建立回归模型时,为保证所建模型的准确性,前期将原始数据进行处理,选取3/4的数据作为训练数据,1/4的数据作为预测数据[22].
利用逐步回归的方法分别对徐汇上师大和浦东川沙建立回归模型如下:
徐汇上师大:
浦东川沙:
从回归模型可以看出两个区域影响PM2.5浓度的污染物也有差别.对于徐汇上师大地区,PM10、CO和SO2是回归模型中的主要自变量;而在浦东川沙地区,PM10、CO、NO2和O3是影响PM2.5的主要自变量.为了验证所建的回归模型的可靠性,笔者对该模型计算所得的预测值与两地区PM2.5的真实值进行了拟合,结果如图 4和图 5所示.
两图中,图(a)为训练数据拟合图,图(b)为预测数据拟合图.在图中,PM2.5真实值与预测值呈显著正相关关系,说明利用其他污染物的浓度预测PM2.5的浓度变化是可行的.根据下图,徐汇上师大和浦东川沙的PM2.5真实值与预测值建立的模型系数为0.92,徐汇上师大的实际拟合线与理想拟合线的角度差相对浦东川沙较小,说明该模型在徐汇上师大处的预测准确性更好.
利用相关系数R和均方根误差RMSE对模型(1)(2)进行分析,结果如表 4所示.从表中看出,徐汇上师大和浦东川沙地区使用训练数据和预测数据所得出的模型R均为0.92,训练数据RMSE分别为16.44和18.62,预测数据RMSE分别为16.68和19.10,预测数据的RMSE均大于训练数据RMSE.浦东川沙地区RMSE均高于徐汇上师大地区,同样说明徐汇上师大地区利用逐步回归的准确性高于浦东川沙地区.
根据以上建立的回归模型和参数评估,说明空气中的其他污染物对PM2.5浓度的变化都有贡献,不同区域其他污染物对PM2.5的影响也有差别.
2.1. PM2.5全年污染水平
2.2. 污染物主成分分析
2.3. PM2.5与PM10相关性分析
2.3.1. PM2.5和PM10浓度月变化
2.3.2. PM2.5和PM10浓度日变化
2.3.3. PM2.5浓度的预测
-
本文分析上海市市区和郊区的PM2.5浓度与大气中的其他污染物之间的相关关系,得出以下结论:
1) 本文利用主成分分析研究6种污染物的相关性,结果表明汇上师大与浦东川沙地区的PM2.5与PM10均是由第一主成分解释的,说明PM2.5和PM10存在强相关关系,这与它们的表现形态和成因有关.
2) 基于主成分分析的结果,对PM2.5、PM10和PM2.5/PM10的月变化和日变化特征进行分析.结果表明在季节分布上PM10和PM2.5具有相同变化趋势,均表现为:夏秋季浓度低,冬春浓度高.但PM2.5/PM10则呈现出夏冬季节高,春秋季节低的特征.分析后得到颗粒物的粒径分布特征在一定程度上与监测点周边的污染源及气象因素有关.市区和郊区的PM2.5和PM10浓度的日变化都呈双峰性,在早上(8:00-10:00)和晚间(18:00-21:00)达到峰值. PM2.5/PM10的日变化范围在50%~90%,说明空气中PM2.5为首要污染物.
3) 根据污染物之间的相关系数,PM2.5与PM10、NO2、SO2、CO之间存在显著正相关关系,与O3之间存在负相关关系.基于大气中污染物之间的相关性,利用逐步回归的方法建立模型分析PM10、NO2、SO2、CO、O3对PM2.5的影响,结果表明大气中PM2.5浓度的变化会受到其他污染物的共同作用,不同区域影响PM2.5浓度变化的污染物也有所区别.