引 言
近年來,土壤重金屬污染已經成為一個嚴重的環境問題,尤其是在城市快速擴張、工業迅速發展的國家和地區,研究表明,我國耕地土壤重金屬污染的概率約為16.67%,土壤重金屬污染的面積大約占據耕地總面積的六分之一。Pb是土壤中常見的一種重金屬污染物,滲透迚土壤中后移動性較差,殘留時間長,不僅影響農作物質量,人類的健康,而且會影響整個生態系統的安全。因此,開展土壤重金屬Pb含量調查和監測方法研究具有重要意義。高光譜遙感通過獲取連續且精細的土壤反射光譜,能夠體現出土壤成分的細微變化,具有低成本大范圍快速監測土壤重金屬狀況的潛力。
迄今為止,大多數研究聚焦進行建模。野外光譜會受到環境因素(土壤粒徑和含水量等)的影響,且由于土壤樣本難以獲取,樣本數一般偏少,導致數據差異性不足。目前去除環境因素的光譜轉換算法主要包括:Spiking、外部參數矯正(EPO)算法以及直接矯正(DS)算法,這些環境因素除去算法在土壤有機質(碳)和粘土含量等屬性參量高光譜反演方面有較好的應用,但在土壤重金屬反演方面的應用還鮮有觸及。現有研究大多以全譜段建模為主,未能充分利用土壤組分對土壤重金屬的吸附作用機理。土壤光譜曲線上很難直接探測到土壤重金屬的自身光譜特征,直接通迆土壤重金屬的光譜響應特征反演重金屬含量不可行,然而通過借助重金屬元素與土壤光譜活性物質(有機質、黏土礦物、鐵氧化物)之間的吸附或賦存關系,可以間接反演土壤重金屬元素含量,此為土壤重金屬的高光譜間接反演機理。
本文以河北雄安一般農作區為例,利用野外光譜開展重金屬Pb含量反演的研究,本文在去除環境因素對野外光譜影響的基礎上,通過結合野外光譜與實驗室光譜建模的方法,提高樣本的差異性,以期提高反演精度。同時,研究中提取了對重金屬Pb起主要吸附作用的土壤光譜活性物質的特征譜段作為模型的輸入,探討了特征譜段建模相對于全譜段建模的有效性。
1研究數據與預處理
1.1 研究數據
土壤樣本采集的時間為2018 年9 月,采集地點主要在河北雄安新區的雄縣和安新縣的一般農作區農田。野外光譜采集可使用的是萊森光學 iSpecField-WNIR地物光譜儀,測量波長范圍為250-2500nm,共獲取70 個樣點的土壤樣本及配套野外土壤光譜。將土壤樣本在實驗室風干研磨后分別過20 目和100 目篩制成標準樣,一部分用于電感耦合等離子體質譜儀ICP-MS測定Pb 含量,另一部分用于測定實驗室光譜,測量儀器同野外光譜采集。
1.2 數據預處理
野外光譜測量時, 大氣中的水汽在1400nm 和1900nm 處存在強吸收, 且1900~2500nm 區間的光譜存在較嚴重噪聲。為去除大氣水汽等噪聲影響,幵保留盡可能多的光譜區間,將1800nm 之后的光譜波段從土壤野外光譜中剔除,對350~1800nm光譜使用分段SG 濾波迚行去噪處理,其中890~1020nm 和1330~1520nm 為中等噪聲,采用窗口大小為15 的二次多項式,其余區間為輕度噪聲,采用窗口大小為7 的二次多項式。利用去除噪聲后的350~1800nm 的野外光譜進行土壤鐵氧化物特征譜段提取及重金屬含量估算。
實驗室光譜在350~1800nm 區間存在不同程度的光譜噪聲,同樣采取分段SG 濾波處理,350~500nm 和1000~1800nm 為中度噪聲區間,采用窗口大小為15 的二次多項式進行噪聲去除;剩余的500~900nm 為輕度噪聲區間,采用窗口大小為7 的二次多項式進行噪聲去除。
2 研究方法
2.1 鐵氧化物特征譜段提取
遙感反射率 Rrs=Lw/Ed(0+) , 即對水體的遙感反射率的計算必須要測量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
土壤中對Pb 起主要吸附作用的物質為鐵氧化物,有研究表明,鐵氧化物的吸收特征在500nm和950nm附近的吸收峰。因此,本文從雄安70條有效土壤光譜中提取500nm和950nm為中心的鐵氧化物吸收峰,提取波段區間為Bm-W/4,Bm+W/4,其中是最大的吸收波段, 是吸收區域的寬度,最終鐵氧化物特征譜段提取出的光譜波段范圍為450.7~523.2nm 以及914.2~1027.9nm。
圖1 方法技術路線
2.2 DS轉換算法
DS 算法是一種常用的環境因素去除算法,它的目的是為了通過轉換數據集,根據對應的野外光譜和實驗室光譜之間的關系,計算出轉換矩陣幵對野外光譜進行轉換,去除野外光譜上環境因素的影響,如水分、顆粒大小和溫度的影響。
在DS 轉換的過程中,需要選擇有代表性和差異性的土壤樣本作為轉換集,用于計算轉換矩陣,因此本文用Kennard-Stone 算法來篩選樣本,具體步驟如下:
1. 首先計算兩兩樣本之間距離,選擇距離最大的兩個樣本;
2. 然后分別計算剩余樣本與已選兩樣本之間的距離;
3. 對于每個剩余樣本而言,計算其與已選各樣本之間的最短距離,選擇這些最短距離中相對最大的距離所對應的樣本,作為新入選的樣本;
4. 重復步驟3,直至所選樣本的個數等于事先設定的數目為止。
2.3 GA-PLSR建模
在高光譜建模中,波段選擇有利于降低模型復雜度,同時提高模型估算精度。遺傳算法(GA)是一種隨機的全局尋優算法,在偏最小二乘回歸(PLSR)建模中被認為是一種有效的波段選擇算法。GA-PLSR已經被用于土壤反射光譜估算有機碳和重金屬含量研究,取得了降低模型復雜度和提高模型估算精度的效果。因此,本文采用GA-PLSR 構建土壤重金屬含量反演模型。
參考已有GA-PLSR 建模研究,將GA參數設置為:染色體個數20,迭代次數1000,代際間隙90%,基因變異概率10%。本文中用均方根誤差(ror,RMSE)作為GA 算法中適應度的評判標準,即目標函數,用RMSE 值小的個體替換父一代中RMSE 值大的個體,不斷反饋產生新解進行下一輪迭代,直到達到最大的迭代次數,最終將RMSE 最小的個體作為最優解輸出,認為此時建立的PLSR 為最優的模型。
2.4 模型評價標準
精度評定采用預測均方根誤差(RMSEP)、剩余估算偏差(RPD) 和決定系數(R2)3 個評價指標。3 個評價指標,RMSEP 值越小,RPD 值越大,R2值越接近1,說明反演模型的精度越高;反之,RMSEP 值越大,RPD 值越小,R2值越小,說明反演模型的精度越低,本文模型優劣參考現有的土壤屬性含量高光譜估算的評價標準:出色模型,R2> 0.9;良好模型,0.9 > R2 > 0.8;近似模型,0.8 > R2> 0.65;具有一定估算能力,0.65 > R2> 0.50;不具備估算能力,0.50 > R2。
3實驗結果與分析
3.1 樣本集劃分
遙感反射率 Rrs=Lw/Ed(0+) , 即對水體的遙感反射率的計算必須要測量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
表1 樣本集Pb含量統計(mg/kg)
本文將經過數據預處理后的70 個樣本按照2:1 的比例劃分為訓練集和測試集,訓練集包括47 個樣本,測試集包括23 個樣本,訓練集用于進行PLSR 模型建立時訓練模型,測試集用于帶入訓練后的模型中估算重金屬Pb 的含量,幵計算評價指標,評估模型估算能力。樣本集的數據統計如表1 所示,從表中可看出劃分的訓練集和測試集與總樣本集的統計特征基本一致。
3.2 DS轉換集大小設定
遙感反射率 Rrs=Lw/Ed(0+) , 即對水體的遙感反射率的計算必須要測量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
DS 轉換算法涉及到轉換集的大小設定,而轉換集選擇的樣本個數影響反演模型的精度,本文實驗了不同轉換集大小對應的反演精度,結果如圖2 所示(由于三種精度指標同步變化,此處僅展示R2),從圖中可以看出,當轉換集的樣本個數為30 時,反演模型的精度最高,因此本文選取30 個樣本的轉換集迚行轉換矩陣計算。
圖2 不同轉換集大小對應建模精度
圖3 反射光譜曲線
將轉換集中對應的野外光譜和實驗室光譜按照2.2 節中的步驟與公式進行計算得到轉換矩陣,用轉換矩陣對所有70 個樣本的野外光譜迚行處理,獲得DS 校正后的野外光譜。校正效果如圖3 所示
由圖3 可看出,經過DS 轉換后的野外光譜,波形與實驗室反射光譜相似,光譜也變得更為平滑,表明通過DS 轉換,能夠較好地去除環境因素(土壤粒徑、含水量等)對野外光譜的影響。
3.3 DS校正及聯合建模精度分析
遙感反射率 Rrs=Lw/Ed(0+) , 即對水體的遙感反射率的計算必須要測量水體的離水輻亮度 Lw與水體表面 入射輻照度 Ed(0+) 。
本節分別采用原始野外光譜、DS 校正后的野外光譜,聯合DS 校正的野外光譜與實驗室光譜進行建模,比較三種光譜的重金屬Pb 估算精度,以及全譜段建模與鐵氧化物特征譜段建模的反演精度。為了避免實驗的偶然性,每組建模實驗均運算五次,取精度最優值作為模型的反演精度。
3.3.1 不同光譜數據建模精度對比分析
圖 4 為未經DS 校正的野外光譜單獨建模的結果,R2 僅為0.5137,屬于具有一定估算能力的模型,可見直接利用野外光譜進行重金屬Pb 含量反演時精度較低。
圖4 原始野外光譜Pb含量估算結果
圖 5 為DS 校正后的野外光譜獨立建模結果,R2 由原始野外光譜建模的0.5137 提高到了0.6276,精度有了明顯提升,說明DS算法去除野外光譜的環境因素影響的有效性。但是,所建模型仍屬于具有一定估算能力的模型,從散點圖中可看出,部分樣本的預測值和測量值之間還存在著較大的差距,精度尚有待提升。
圖 5 為DS校正后的野外光譜獨立建模結果
圖6 DS野外光譜與實驗室光譜聯合建模的Pb含量估算結果
結合 DS 校正的野外光譜和實驗室光譜的建模結果如圖6,樣本點緊密分布于擬合線附近,精度R2 可以達到0.9146,屬于出色模型,由此可見,通過聯合建模增強了樣本的差異性從而使得反演精度得到大幅提高。
3.3.2 鐵氧化物特征譜段建模的有效性分析
表 2 中展示了三類光譜數據分別以全譜段和鐵氧化物特征譜段作為GA-PLSR輸入時的反演精度。除了DS校正野外光譜的全譜段與鐵氧化物特征譜段反演精度相當外,其他兩類光譜數據的鐵氧化物特征譜段反演精度均高于全譜段反演精度,根據模型評價標準,對于未迚行DS 校正的野外光譜而言,通過鐵氧化物特征譜段提取,建模精度R2 從0.22 提升到0.5137,精度得到了大幅的提升,反演模型從不具備估算能力提升為具有一定估算能力;聯合建模的精度R2從0.8952 提升到0.9146,使得反演模型從良好模型提升為出色模型,證明了提取500nm 和950nm的鐵氧化物特征譜段對于提高土壤重金屬Pb反演精度的有效性。
表2 反演精度對比
4結 論
本文針對環境因素對土壤野外光譜乃至土壤重金屬含量高光譜遙感反演的影響、土壤樣本不足及全譜段建模機理性不足問題,以土壤重金屬Pb為例,開展了基于野外光譜的土壤重金屬含量反演方法研究,首先采用DS算法去除環境因素對野外光譜的影響,在此基礎上聯合野外與實驗室光譜,提取對Pb起主導吸附作用的鐵氧化物的特征譜段用于反演建模,在增強樣本的差異性的同時,增強反演的機理性。以雄安一般農作區土壤數據集為例,分析了該方法對提高Pb 含量反演精度的有效性。
研究表明,DS 轉換算法能夠去除環境因素對野外光譜的影響,與原始野外光譜建模相比,反演精度R2 從0.5137 提升到了0.6276;聯合野外光譜與實驗室光譜建模的方法,有利于提高樣本的差異性,引入噪聲極少的先驗知識后,反演精度得到大幅提升,R2 達到0.9146,使得反演模型達到了出色模型的標準。
除了DS校正的野外光譜,全譜段反演精度與鐵氧化物特征譜段反演精度大致相當外,其他光譜類型的結果皆為鐵氧化物特征譜段反演精度顯著優于全譜段反演精度,表明通過提取對重金屬Pb起主要吸附作用的鐵氧化物的特征譜段,降低了數據的冗余度,提高了反演的機理性,對于提高模型反演精度是有效的,且本文提取的鐵氧化物波段在500nm 和950nm的吸收特征對于重金屬Pb 來說確實是敏感有效的特征譜段。
由于野外光譜與同步或準同步獲取的航空/衛星高光譜圖像在土壤自然狀態上最為接近,基于野外光譜的反演方法研究將為高光譜遙感圖像反演土壤重金屬含量奠定基礎。本文方法通過環境因素去除以及基于鐵氧化物特征譜段建模,聯合野外與實驗室光譜顯著提高了土壤Pb含量反演精度,未來可嘗試將該方法應用于同一研究區或同類的多個研究區的多源光譜數據(實驗室、野外、圖像光譜),探討提高基于高光譜圖像反演土壤重金屬含量精度的可行性。
審核編輯:湯梓紅
評論