本章基于原位LIBS技術(shù)利用煤炭全光譜波點(diǎn)與目標(biāo)校準(zhǔn)值之間的相關(guān)性對(duì)獨(dú)立變量進(jìn)行重組,并分別建立了測(cè)定煤樣灰分、揮發(fā)分和熱值的定量模型。為了評(píng)估這種特征工程方法的合理性,又從物質(zhì)成分的角度對(duì)重組變量光譜進(jìn)行了可解釋性實(shí)驗(yàn)。
一、引言
煤質(zhì)分析對(duì)于促進(jìn)煤炭資源的合理利用具有重要意義,其中煤炭的灰分、揮發(fā)分和熱值是影響燃煤電廠混煤入爐、爐膛燃燒等工作的關(guān)鍵信息。傳統(tǒng)的LIBS光譜檢測(cè)需要耗費(fèi)很長(zhǎng)時(shí)間從煤樣光譜中篩選元素的特征譜線。這種選擇特征譜線的方法費(fèi)時(shí)費(fèi)力,而且對(duì)于不同鍋爐的煤炭樣品,需要重新根據(jù)LIBS光譜數(shù)據(jù)來(lái)選擇特征譜線。為解決上述問(wèn)題,本章基于原位LIBS技術(shù)利用煤炭全光譜波點(diǎn)與目標(biāo)校準(zhǔn)值之間的相關(guān)性對(duì)獨(dú)立變量進(jìn)行重組,并分別建立了測(cè)定煤樣灰分、揮發(fā)分和熱值的定量模型。為了評(píng)估這種特征工程方法的合理性,又從物質(zhì)成分的角度對(duì)重組變量光譜進(jìn)行了可解釋性實(shí)驗(yàn)。
定量分析方法
本章采用主成分分析法來(lái)獲取LIBS全光譜中的特征信息作為獨(dú)立變量,然后通過(guò)普通最小二乘回歸法來(lái)構(gòu)建煤炭灰分、揮發(fā)分和熱值的定量模型。為解決獨(dú)立變量中的高階噪聲問(wèn)題,提出一種基于變量重組的特征選擇方法來(lái)提取LIBS光譜中的關(guān)鍵信息,并通過(guò)波點(diǎn)載荷提取的元素特征譜線對(duì)這種特征選擇方法進(jìn)行驗(yàn)證。
1、主成分分析法
主成分分析(PCA)是一種常用的多元數(shù)據(jù)統(tǒng)計(jì)分析方法。主成分表示原始數(shù)據(jù)在正交方向上的分解,主成分分析可以在保留最大信息量的前提下消除共線性問(wèn)題、同時(shí)降低輸入變量的維度。
2、基于變量重組的特征選擇方法
主成分分析是遵循解釋方差大小的順序?qū)χ鞒煞諴C進(jìn)行排序,通常只選擇少數(shù)主成分來(lái)校準(zhǔn)模型,因?yàn)楦唠A的主成分會(huì)存在較大噪音。傳統(tǒng)PCA只根據(jù)光譜數(shù)據(jù)無(wú)法保證所選擇的主成分與校準(zhǔn)值更相關(guān),而且隨著主成分幅度的減小,無(wú)法在循環(huán)中選擇原始主成分的最優(yōu)數(shù)量。因此,通過(guò)引入校準(zhǔn)值與每個(gè)主成分全譜波點(diǎn)解釋方差的相關(guān)性得分,并對(duì)輸入變量進(jìn)行特定排序、篩選。使用這種重組方式可以選擇與校準(zhǔn)值更相關(guān)的主成分,實(shí)現(xiàn)最大化回歸指標(biāo),而不是僅限于選擇少數(shù)的原始主成分作為定量模型的輸入變量。
3、基于波點(diǎn)載荷提取元素特征譜線
主成分載荷是一種用于衡量每個(gè)變量對(duì)主成分貢獻(xiàn)程度的統(tǒng)計(jì)量,通過(guò)計(jì)算變量在主成分上的權(quán)重或系數(shù)來(lái)解釋兩者之間的關(guān)系。
4、普通最小二乘回歸法
普通最小二乘法(OLS)是一種用于估計(jì)線性回歸中未知參數(shù)的方法。線性回歸的目標(biāo)是找到最佳的參數(shù)向量,使得預(yù)測(cè)值和真實(shí)值之間的誤差最小化??梢赃x擇不同的損失函數(shù)來(lái)衡量誤差,并通過(guò)最小化損失函數(shù)求解最佳回歸參數(shù)。
本章的數(shù)據(jù)處理及定量分析過(guò)程可以分為4個(gè)部分:(1)根光譜預(yù)處理方法對(duì)采集到的LIBS煤炭光譜進(jìn)行處理,包括背景光譜去除、多通道光譜歸一化、基于極小值點(diǎn)篩選法的基線校正、異常光譜處理以及元素特征光譜峰值的洛倫茲擬合。(2)劃分煤炭光譜數(shù)據(jù)集,并基于校準(zhǔn)值相關(guān)性和建模結(jié)果對(duì)主成分進(jìn)行特定排序、篩選,從而實(shí)現(xiàn)變量重組。(3)變量重組后的普通最小二乘法建模以及定量分析。(4)基于全光譜變量重組后的載荷信息及相關(guān)性提取元素特征譜線。上述處理過(guò)程中的第(2)部分使用R和RMSECV用于變量重組后定量模型的性能分析,第(3)部分使用R、RMSECV和RMSEP來(lái)評(píng)估回歸模型的性能,第(4)部分使用NIST數(shù)據(jù)庫(kù)與元素特征譜線進(jìn)行對(duì)比。
煤炭灰分、揮發(fā)分和熱值定量分析
本章使用135個(gè)煤樣作為訓(xùn)練集,用于構(gòu)建灰分、揮發(fā)分和熱值定量模型并完成十折交叉驗(yàn)證,33個(gè)煤樣用于模型測(cè)試。其中,需要分別選擇不同數(shù)量未重組和重組后的主成分作為定量模型的獨(dú)立變量。然后,對(duì)訓(xùn)練集樣本進(jìn)行10折交叉驗(yàn)證,獲得R2和RMSECV的平均值。如圖1所示,當(dāng)選擇前40個(gè)未重組的主成分作為獨(dú)立變量時(shí),獨(dú)立變量對(duì)全部光譜波點(diǎn)的累積解釋率達(dá)99.0321%。
圖1LIBS煤樣全光譜的主成分分析結(jié)果
對(duì)于不同的定量任務(wù),重組變量的數(shù)量需要根據(jù)獨(dú)特模型來(lái)選擇,灰分、揮發(fā)分和熱值定量模型所最終選擇的獨(dú)立變量個(gè)數(shù)如圖2所示。隨著獨(dú)立變量數(shù)量的增加,定量模型R的總體趨勢(shì)先變大后變小,而RMSECV總體趨勢(shì)先變小后變大。值得注意的是,變量未重組和變量重組后的定量模型在交叉驗(yàn)證曲線上存在巨大差異。這是因?yàn)?,隨著未重組變量數(shù)量的增加,累積解釋率的方向不一定更好解釋校準(zhǔn)值的變化。而且,更高階的未重組變量會(huì)存在更多噪聲,這會(huì)降低回歸模型的性能,從而導(dǎo)致RMSECV增加。通過(guò)變量重組,可以選擇更多真實(shí)特征而不是噪聲作為獨(dú)立變量,得到更平坦的收斂曲線。在交叉驗(yàn)證過(guò)程中,R、RMSECV和N(獨(dú)立變量的個(gè)數(shù))同時(shí)考慮。當(dāng)R最大、RMSECV最小時(shí),此時(shí)所選擇的N對(duì)應(yīng)回歸模型的校準(zhǔn)效果越好。
圖2變量重組前后獨(dú)立變量個(gè)數(shù)的提取結(jié)果
變量重組前后,普通最小二乘定量模型分析煤質(zhì)參數(shù)的流程為:首先,對(duì)煤樣中的訓(xùn)練集樣本進(jìn)行交叉驗(yàn)證,得到R和RMSECV。然后,使用訓(xùn)練模型對(duì)33個(gè)測(cè)試樣本進(jìn)行分析,定量結(jié)果如圖3所示。其中,誤差棒是10次重復(fù)測(cè)量測(cè)試集RMSEP的結(jié)果。從圖3可以明顯看出,灰分、揮發(fā)分和熱值的預(yù)測(cè)結(jié)果都優(yōu)于定量模型在變量未重組時(shí)獲得的結(jié)果。對(duì)于變量重組后的灰分定量模型,訓(xùn)練集和測(cè)試集的R、RMSECV、RMSEP分別為0.9701,0.9818,0.7153wt%,0.7037wt%。其中灰分的RMSECV下降59.91%,RMSEP下降60.23%。對(duì)于變量重組后的揮發(fā)分定量模型,訓(xùn)練集和測(cè)試集的R、RMSECV、RMSEP分別為0.9458,0.9429,0.5678wt%,0.6628wt%。揮發(fā)分的RMSECV下降51.87%,RMSEP下降53.65%。對(duì)于變量重組后的熱值定量模型,訓(xùn)練集和測(cè)試集的R、RMSECV、RMSEP分別為0.9858,0.9811,0.1518MJ/kg,0.1613MJ/kg。其中,RMSECV下降84.06%,RMSEP下降84.15%。表1為變量重組前后的定量模型評(píng)估指標(biāo),表中灰分和揮發(fā)分含量的單位為wt%,熱值的單位為MJ/kg。綜上所述,變量重組后灰分、揮發(fā)性物質(zhì)和熱值校準(zhǔn)模型的RMSEP降低53~84%,這意味著變量重組后的定量模型可以更好的預(yù)測(cè)煤質(zhì)工業(yè)指標(biāo)含量。
圖3變量重組前后的定量分析結(jié)果
表1變量重組前后OLS定量模型的評(píng)估指標(biāo)
四、特征工程的可解釋性實(shí)驗(yàn)
為了驗(yàn)證這種全光譜特征選擇方法對(duì)于LIBS煤炭原始光譜數(shù)據(jù)集的可解釋性,分別對(duì)灰分、揮發(fā)分和熱值校準(zhǔn)模型中獲取的重組變量進(jìn)行相關(guān)性排序。并基于煤樣LIBS全光譜波點(diǎn)載荷的累積值,來(lái)提取三種煤質(zhì)指標(biāo)相關(guān)的原子或分子特征譜線。首先,對(duì)每個(gè)校準(zhǔn)模型重組變量的相關(guān)性進(jìn)行排序,排序結(jié)果如圖4中的(a)、(c)和(e)所示。由圖可知,前20個(gè)重組變量與目標(biāo)校準(zhǔn)值的相關(guān)性較高。但是,隨著重組變量個(gè)數(shù)的增加,可以看到重組變量的相關(guān)性曲線并不平坦。這是因?yàn)榻忉屧脊庾V方差的方向不一定與校準(zhǔn)值更相關(guān)。雖然,后續(xù)重組變量的相關(guān)性減弱,但是依舊包含與目標(biāo)校準(zhǔn)值相關(guān)的真實(shí)信息。經(jīng)過(guò)重組變量,從煤炭光譜數(shù)據(jù)中提取了更多的相關(guān)特征作為輸入變量。
圖4變量重組的相關(guān)性排序和全光譜波點(diǎn)的篩選結(jié)果
然后,計(jì)算每個(gè)校準(zhǔn)模型中重組變量在全光譜波點(diǎn)載荷上的累積相關(guān)值,并將每個(gè)波點(diǎn)載荷的累積相關(guān)值調(diào)整到區(qū)間[1,-1]。最后再分為以下四個(gè)步驟:(1)對(duì)LIBS全光譜進(jìn)行尋峰,得到283個(gè)譜線。(2)選定C@761.21nm和O@764.86nm兩條連續(xù)元素特征譜線進(jìn)行洛倫茲峰值擬合。(3)對(duì)累積相關(guān)值中絕對(duì)值較大的波點(diǎn)進(jìn)行篩選。(4)根據(jù)NIST原子光譜數(shù)據(jù)庫(kù)對(duì)篩選后的波點(diǎn)進(jìn)行判定,從而得到三種煤質(zhì)指標(biāo)相關(guān)的元素特征譜線?;谌庾V波點(diǎn)載荷篩選后的結(jié)果如圖4中的(b)、(d)和(f)所示,從灰分、揮發(fā)分和熱值定量模型的輸入變量中提取的元素特征譜線如表2所示。
表2從NIST數(shù)據(jù)庫(kù)中提取灰分、揮發(fā)分和熱值的特征譜線波長(zhǎng)
煤中的灰分主要由金屬元素氧化物組成,包括CaO、MgO、KO、NaO、SiO、TiO、AlO、FeO等。因此,Ca、Mg、K、Na、Si、Ti、Al、Fe和Zn等金屬元素可作為影響灰分含量的關(guān)鍵指標(biāo)。類似地,C、H、O、N、S等非金屬元素和Si、Fe、Ca、Mg和Ti等金屬元素決定了煤的揮發(fā)性成分和熱值。變量重組后,提取煤炭灰分、揮發(fā)分和熱值相關(guān)的元素特征譜線分別如圖5中的(a)、(b)和(c)所示。對(duì)于灰分含量,獲得了二十九條特征譜線,包括八種金屬元素(K、Ti、Fe、Zn、Na、Mg、Ca、Si)、三種非金屬元素(C、N、O)和一條CN雙分子譜線。其中,金屬元素對(duì)應(yīng)于灰分的主要成分,非金屬元素和CN@387.25nm均與灰分呈負(fù)相關(guān)。對(duì)于揮發(fā)分,獲得了包括金屬和非金屬元素在內(nèi)的25條特征譜線。其中,有五種金屬元素(Ti、Fe、Ca、Si、Na),五種非金屬元素(C、H、O、N、S)和三種CN雙分子譜線。值得注意的是,C@260.08nm、CN@385.10nm、CN@387.25nm、CN@387.64nm、H@486.13nm、C@581.83nm、C@761.21nm、O@764.86nm與揮發(fā)性物質(zhì)呈正相關(guān),S@579.75nm呈負(fù)相關(guān)。
圖5變量重組后元素特征譜線的提取結(jié)果
這是因?yàn)閾]發(fā)分的組成成分主要包括碳?xì)浠衔?、氫氣和一氧化碳等物質(zhì)。而在高溫下,硫與碳會(huì)反應(yīng)形成硫化物,從而抑制煤中揮發(fā)性物質(zhì)的釋放。因此,隨著煤中硫含量的增加,煤中的揮發(fā)分會(huì)減少。C@193.04nm、C@247.86nm和N@493.51nm的負(fù)相關(guān)可能是揮發(fā)分測(cè)試集擬合系數(shù)僅為94.29%的主要原因。對(duì)于熱值,獲得了包括金屬元素、非金屬元素和CN雙分子譜線在內(nèi)的27條特征譜線。其中,有五種非金屬元素(C、H、O、N、S)和六種金屬元素(Fe、Mg、Ca、Si、Ti、Na)。C、H、O、N和CN的譜線與熱值呈正相關(guān),而S@579.75nm與熱值呈負(fù)相關(guān)。這是因?yàn)槊褐械腃、H、O、N是產(chǎn)生熱量的主要來(lái)源,硫化物的形成會(huì)導(dǎo)致煤的熱值下降。因此,降低煤中的硫含量可以增加其揮發(fā)分和熱值。而當(dāng)煤炭在正常空氣氛圍下進(jìn)行LIBS實(shí)驗(yàn)時(shí),碳和氮反應(yīng)產(chǎn)生的CN雙分子線也會(huì)通過(guò)碳元素間接影響揮發(fā)分和熱值。
五、結(jié)論
對(duì)于煤炭的灰分、揮發(fā)分和熱值,利用LIBS技術(shù)并基于全譜點(diǎn)解釋方差與校準(zhǔn)值之間的相關(guān)性,對(duì)輸入變量進(jìn)行了重組處理,分別建立了三種定量檢測(cè)模型。經(jīng)變量重組后,從原始光譜中提取了更多與目標(biāo)任務(wù)相關(guān)的元素特征譜線來(lái)預(yù)測(cè)灰分(從18到100)、揮發(fā)分(從7到99)和熱值(從18至113)。結(jié)果表明,變量重組后灰分、揮發(fā)分和熱值定量模型的R分別為0.9818、0.9429和0.9811,RMSECV和RMSEP分別降低了51.87~84.06%和53.65~84.15%。為了證明變量重組對(duì)于煤炭LIBS光譜的可解釋性,本章又基于全光譜波點(diǎn)載荷和變量重組的相關(guān)性完成了進(jìn)一步的可解釋性實(shí)驗(yàn)。結(jié)果表明,八種金屬元素與灰分的主要成分相對(duì)應(yīng),三種非金屬元素與CN雙分子譜線均呈負(fù)相關(guān)。揮發(fā)分包括五種非金屬元素和五種金屬元素,其中氮和一些碳元素的負(fù)相關(guān)性降低了校準(zhǔn)模型的預(yù)測(cè)能力。熱值包括五種非金屬元素和六種金屬元素。揮發(fā)分和熱值與非金屬元素的正相關(guān)性符合其物質(zhì)組成成分。硫元素的負(fù)相關(guān)性是由于煤在燃燒過(guò)程中產(chǎn)生了硫酸鹽和含硫氧化物,而較高的硫元素水平會(huì)導(dǎo)致煤炭揮發(fā)量和熱值較低。上述定量分析過(guò)程證明了LIBS技術(shù)結(jié)合變量重組后的定量模型能夠準(zhǔn)確煤炭的灰分、揮發(fā)分和熱值。后續(xù)對(duì)于不同類型的煤樣,該方法還可以通過(guò)基體效應(yīng)校正進(jìn)行優(yōu)化。此外,該方法還可以推廣到煤炭和其他物質(zhì)中主要元素的檢測(cè)。
推薦:
激光誘導(dǎo)擊穿光譜技術(shù)在低碳鋼鐵冶金行業(yè)的應(yīng)用
LlBS激光誘導(dǎo)擊穿光譜系統(tǒng)是該技術(shù)通過(guò)超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對(duì)等離子體發(fā)射光譜進(jìn)行分析,識(shí)別樣品中的元素組成成分,可以進(jìn)行材料的識(shí)別、分類、定性以及定量分析。
歡迎關(guān)注公眾號(hào):萊森光學(xué),了解更多光譜知識(shí)。
萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。
審核編輯 黃宇
-
光譜
+關(guān)注
關(guān)注
4文章
818瀏覽量
35151 -
PCA
+關(guān)注
關(guān)注
0文章
89瀏覽量
29594
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論