-
开放科学(资源服务)标志码(OSID):

-
柴油属于原油加工获得的一类产品,一般在(175~375) ℃范围内沸腾,主要表现为含有8~24个碳原子的化合物[1-2]. 柴油中的硫及硫化物在使用过程中会产生大量二氧化硫、三氧化硫等有害气体. 在温度较高的情况下,这些有害气体可能会和发动机表面的某些金属物质发生一系列化学反应,不仅会使润滑油老化变质,还会造成机械表面腐蚀,严重影响发动机的寿命. 同时,大量的硫燃烧会对大气造成严重的污染,也会对人体健康产生危害[3-5]. 为了改善空气质量,世界许多国家都制定了环境法规,通过限制排放水平来减少SOx的排放. 因此,快速测定柴油的硫质量分数,对于柴油品质的正确评价具有重要意义. 目前国内外对柴油硫质量分数检测采用的主要方法为荧光光谱,Ranzan等[6]使用激励-发射矩阵(EEM)荧光光谱法来测量柴油硫质量分数,对硫质量分数小于10 mg/kg组的柴油进行测量,其平均绝对百分比误差(MAPE)小于0.24%,预测均方根误差为0.015. 对平均硫质量分数为100 mg/kg组的柴油进行测量,MAPE小于4%,预测均方根误差为4.68. Ranzan等[7]直接利用二维荧光光谱技术能够将柴油总硫质量分数小于10 mg/kg和柴油硫平均质量分数在100.3 mg/kg的样品组进行分类,并将单个荧光光谱成分结合多元线性模型来定量预测柴油中的硫质量分数. Aburto等[8]提出了在测量荧光光谱之前用酶氧化对样品进行预处理,能够准确和可重复地测量超低硫柴油,其预测硫质量分数与实际硫质量分数的R2为0.95. Cruz等[9]应用电感耦合等离子体发射光谱法来测定柴油硫质量分数,其测量结果与标定测量符合度为95%. 便携式近红外光谱仪具有分析速度快、对样品无损、操作简单等优点. 2012年,Zamora-Rojas等[10]应用便携式近红外光谱技术对肉类中的脂肪、水分和蛋白质质量分数进行了量化,精确值分别为0.72%,0.73%和0.66%. Paiva等[11]通过PLS模型评估了使用超紧凑型分光光度计(MicroNIR)和傅里叶变换台式仪器(FT-NIR)对生物柴油/柴油混合物中的植物油进行量化的方法,建立了两种仪器之间的预测均方根误差相似值,证明了这种便携式设备的可行性. Correia等[12]利用microNIR光谱数据建立了化学计量学模型并对柴油中生物柴油、硫的质量分数进行了预测. 综上所述,基于便携式近红外光谱技术在燃油质量控制方面具有优异的性能. 本文应用便携式近红外光谱仪采集不同硫质量分数的柴油的近红外光谱数据,采用不同的预处理方法和谱区选择方法,建立了柴油硫质量分数定量预测模型,实现了对柴油硫质量分数快速和无损的近红外定量检测.
全文HTML
-
实验使用了5种不同硫质量分数的柴油样品,其编号分别为:s10,s100,s200,s500,s1000,根据《轻质烃及发动机燃料和其他油品的总硫含量测定法》(SH/T 0689-2000)[13]对样品中的硫质量分数进行测定,其硫质量分数分别为:10.3,104.0,209.0,524.0,1 038.0 mg/kg. 为了扩大柴油硫质量分数的浓度范围,将上述5个样品按已制定好的方案进行配制. 取样采用移液枪,利用分析天平(岛津AUW220)进行配制;然后用磁力搅拌器(LAB FISH的MS5)在1 000 r/min下将样品搅拌10 min,以便混合均匀,之后装瓶贴上样本标签,一共获得了261份不同硫质量分数的柴油样品,其质量分数范围为10.3~1 038.0 mg/kg. 样品统计结果如表 1所示.
-
采用天津九光科技发展责任有限公司的便携式近红外光谱仪(NIR spectrometer),如图 1所示,对每份样品进行光谱采集,采集条件为:仪器数据采集软件为Milk-new,近红外光谱波长范围为900~1 700 nm,积分时间为2 ms,波长间隔为8 nm,光谱点数为101,室内环境温度为25 ℃. 261份柴油硫质量分数原始近红外光谱如图 2所示.
-
PLS分析是一种多元统计数据分析法[14]. 利用PLS建立光谱矩阵(X)与浓度矩阵(Y)之间的关系,来预测具有最小潜在变量的一组样品的浓度. 首先将包括光谱矩阵和浓度矩阵的数据集分成校正集和预测集,PLS对光谱矩阵和浓度矩阵进行分解,其模型为
式中,tk为光谱矩阵的第k个主因子的得分;pk为吸光度矩阵的第k个主因子的载荷;uk为浓度矩阵的第k个主因子的得分;qk为浓度矩阵的第k个主因子的载荷;f为主因子数. 即:T和U分别为X矩阵和Y矩阵的得分矩阵,P和Q分别为X矩阵和Y矩阵的载荷矩阵,EX和EY分别为X矩阵和Y矩阵的PLS拟合残差矩阵.
然后将T和U做线性回归:
在预测时,首先根据P求出未知样品的光谱矩阵X未知的得分T未知,然后由下式得到浓度矩阵的预测值:
-
高斯过程回归[15]是基于贝叶斯方法非参数概念模型,任意有限数量随机变量的组合都具有联合高斯分布,GPR的表达式为
其中:x为满足多元高斯分布的N组独立的学习样本,ε为独立同分布的噪声变量,其服从:
在高斯过程回归模型中,回归函数f(X)为一个高斯过程,由其均值函数m(X)和协方差函数k(X,X′)来描述. 如公式(8)所示:
其中:
在GPR中,我们假设f服从均值为0的高斯分布.
当给定测试值,预测输出y*与输出y的联合分布也服从高斯分布,即:
在已知取得训练集D={X,y }的条件下,y*的后验条件分布为
1.1. 样品制备
1.2. 光谱采集
1.3. 实验算法原理
1.3.1. 基于偏最小二乘法(PLS)的近红外光谱定量分析方法
1.3.2. 基于高斯过程回归(GPR)的近红外光谱定量分析方法
-
对于261份不同柴油硫质量分数的样品,利用Kennard-Stone(K-S)算法[16]对不同硫质量分数柴油的数据进行划分,按接近3∶1分配,即校正集和预测集分别包含174份和87份柴油硫质量分数样品.
在原始光谱中,除了化学信息外,光谱还包含其他不相关或不需要的信息,如电噪声、基质背景、杂散光、散射效应等. 在用化学计量学方法建立校准模型时,利用预处理方法消除光谱数据中的无关信息和噪声是非常必要的. 分别对原始光谱采用去中心化、归一化、多元散射校正、15点2次平滑、一阶微分、二阶微分等预处理方法,然后运用PLS方法进行建模,其结果如表 2所示.
由表 2知:经过15点2次平滑,一阶微分+15点2次平滑,二阶微分+15点2次平滑的预处理后,建的模型质量不佳. 而经过去中心化、归一化、多元散射校正等预处理方法后,模型的预测能力有明显的提升,其中去中心化结果最优,其R2由0.881提升到0.893,RMSEP值由93.69降到89.17,RPD值由2.903提升到3.089,故选择去中心化的光谱数据预处理方法,其预处理后的光谱数据如图 3所示.
-
波长(变量)选择可以提高模型的预测能力,简化模型,将去中心化预处理后的柴油硫质量分数光谱数据用竞争性自适应加权抽样(CARS)[17-18]、蒙特卡罗无信息变量消除(MCUVE)[19]特征波段筛选方法对101个波长点进行提取,将与预测柴油硫质量分数无关的特征变量进行去除,CARS算法共去除了66个无关信息波长点,保留信息变量35个,最终所选取的波段如图 4所示. 用全部波段的34.65% 建立柴油硫质量分数的定量分析模型,预测结果如图 5所示,其预测模型R2的值为0.939,RMSEP的值为61.67,RPD的值为4.084. MCUVE算法去除了61个无关信息波长点,保留信息波长40个,其选取的波段如图 4所示,用全部波段的39.60% 建立柴油硫质量分数的定量分析模型,预测结果如图 5所示,其预测模型R2的值为0.932,RMSEP的值为65.23,RPD的值为3.895.
将建立的MCUVE与CARS模型与整个波段回归模型进行比较,由表 3可知,经波长筛选模型质量明显提高,其中CARS模型质量最优且选择的变量数更少,故采用CARS算法选取的变量进行建模分析.
-
将CARS算法选取的35个特征波长点,利用高斯过程回归作为建模算法,按照上述相同的方法对全部样品进行校正集和验证集划分,用校正集中的174个样品建立GPR模型,对预测集中的87个样品进行验证. 应用GPR建立柴油硫质量分数定量模型,本实验中核函数采用Matern5/2核,基函数为常量,其预测模型的R2为0.967、RMSEP值为45.378、RPD值为5.616. 其预测结果如图 6所示.
2.1. 光谱数据预处理
2.2. 基于CARS-PLS的柴油硫质量分数预测模型
2.3. 基于高斯过程回归的柴油硫质量分数预测模型
-
本文利用不同柴油硫质量分数在900~1 700 nm波段范围内的便携式近红外光谱信息,在全谱区选择不同的预处理方法,建立了柴油硫质量分数的近红外光谱定量分析建模. 实验结果表明,去中心化光谱预处理方法表现最优,其R2为0.894,RMSEP值为89.17,RPD值为3.089. 采用MCUVE与CARS方法选取特征波长来提升模型预测能力,所得结果明显优于全谱建模结果. 经过CARS特征波长选择后,从101个波长点中筛选出35个波长点,用于高斯过程回归建立柴油硫质量分数的预测模型,其预测模型的R2为0.967,RMSEP值为45.378,RPD值为5.616. 实验结果表明,基于便携式近红外光谱仪的柴油硫质量分数检测具有可行性.
下载: