1 引言
區(qū)域土壤重金屬污染評價是土壤環(huán)境研究的和污染防治的重要基礎(chǔ)目前對區(qū)域土壤重金屬污染程度的評價方法已有很多研究,如單因子指數(shù)法、地累積指數(shù)法、生態(tài)風(fēng)險系數(shù)法等簡單指數(shù)法,內(nèi)梅羅指數(shù)、加權(quán)綜合指數(shù)、生態(tài)風(fēng)險綜合系數(shù)等綜合指數(shù)法,這些評價模型在土壤重金屬評價領(lǐng)域得到了廣泛應(yīng)用.為了解決傳統(tǒng)的指數(shù)法評價難以描述土壤重金屬污染的不確定性問題,模糊數(shù)學(xué)方法在土壤重金屬污染評價領(lǐng)域得到廣泛的應(yīng)用.核密度估計法不對數(shù)據(jù)的分布形式進(jìn)行預(yù)先的假設(shè),具有更廣泛的適用性,但目前核密度估計模型在自然科學(xué)上的應(yīng)用不多,主要是集中在社會、經(jīng)濟(jì)以及醫(yī)藥等領(lǐng)域.
不同評價方法各有應(yīng)用特點(diǎn),評價方法主要是掌握研究區(qū)域總體污染程度,但很少有學(xué)者對不同方法評價結(jié)果進(jìn)行系統(tǒng)的總結(jié)與比較,即使有也僅僅停留在理論上的介紹,缺乏定量探討各方法評價結(jié)果的差異(范拴喜等,2010;郭笑笑等,2011).因此,本文以經(jīng)濟(jì)快速發(fā)展的昆山市為例,采用簡單數(shù)理統(tǒng)計、正態(tài)模糊數(shù)法和核密度估計法對研究區(qū)土壤重金屬總體污染程度進(jìn)行評價,從評價便捷性、結(jié)果的準(zhǔn)確度與全面性方面揭示各方法的差異.
2 研究區(qū)概況
昆山市位于江蘇省東南部,上海和蘇州之間,地處東經(jīng)120°48′21″~121°09′04″E,北緯31°06′34″~ 31°32′36″N,是上海經(jīng)濟(jì)圈重要的新興工商城市,2013年人均GDP達(dá)2.89萬美元,連續(xù)9年被評為全國百強(qiáng)縣市之首.昆山市屬于典型的北亞熱帶季風(fēng)氣候,年平均氣溫17.6 ℃,年平均降水量1200.4 mm,全市土壤分為水稻土、潮土、沼澤土、黃棕壤4個土類,水稻土在各類土壤總面積中占比最高,達(dá)93.8%.
3 數(shù)據(jù)來源和方法
3.1 數(shù)據(jù)來源
研究數(shù)據(jù)為2 km×2 km網(wǎng)格的土壤采樣測試數(shù)據(jù),將研究區(qū)劃分成2 km×2 km的網(wǎng)格,每個網(wǎng)格作為一個采樣點(diǎn),對于區(qū)域邊界上的破碎網(wǎng)格按照四舍五入來處理,共選取232個樣點(diǎn).按照5點(diǎn)混合采樣法采集0~20 cm表層土壤樣品,四分法取分析樣品約1.5 kg.樣品經(jīng)自然風(fēng)干,挑除石礫和植物殘體,研磨過100目篩,并充分混勻以待用.
圖1 采樣點(diǎn)分布圖
本文側(cè)重研究不同方法下土壤重金屬污染程度評價結(jié)果的差異,較土壤重金屬綜合污染評估而言,單元素評估可以免去綜合污染的加權(quán)求和,能減少不同權(quán)重對結(jié)果的干擾.已有研究表明:作為水網(wǎng)地區(qū)的昆山市土壤As含量相對不高,空間分異程度也較小;Cd含量相對較高,空間分異程度也較大(萬紅友等,2006;鐘曉蘭等,2008).這兩種元素具有較強(qiáng)的代表性,能在污染評估結(jié)果中形成較為鮮明的對比,因此,本文選取As和Cd為代表元素進(jìn)行研究.Cd采用分別加入濃鹽酸、濃硝酸在150 ℃的有孔電熱板上加熱反應(yīng)、再加入HF-HNO3-HClO4置于200 ℃有孔電熱板上加熱消解后,采用ICP-MS法測定;As采用1 ∶ 1的王水沸水浴消解后用還原氣化-原子熒光光譜法進(jìn)行測定.
3.2 研究方法
3.2.1 地累積指數(shù)法
地累積指數(shù)法通常稱為Muller指數(shù),能很好地反映自然變化與人為活動因素對重金屬分布帶來的影響,它以研究區(qū)重金屬含量背景值為標(biāo)準(zhǔn),是評價區(qū)域重金屬污染的重要污染指數(shù).具體公式如下:
式中,Ci為土壤重金屬元素i的實(shí)測含量(mg · kg-1); Bi為元素i的區(qū)域背景值(mg · kg-1);k為修正系數(shù),一般取為1.5.根據(jù)地累積指數(shù)值Igeo,將土壤重金屬污染程度劃分為5個等級.其中Igeo≤0時為0級,清潔;03時為4級,嚴(yán)重污染.
本文的重金屬含量背景值采用應(yīng)用廣泛的《中國土壤元素背景值》(國家環(huán)境保護(hù)局和中國環(huán)境監(jiān)測總站,1990)中全國各省份土壤微量金屬元素背景值.
3.2.2 正態(tài)模糊數(shù)模型
模糊數(shù)法是針對區(qū)域土壤重金屬污染的模糊、不確定性特征所進(jìn)行的評價,能更為全面地反映重金屬污染程度信息,可解決傳統(tǒng)的指數(shù)法評價難以描述土壤重金屬污染的不確定性問題.模糊數(shù)模型的核心是構(gòu)建隸屬度函數(shù),目前主要是采用線性形式來進(jìn)行描述,例如三角與梯形模糊數(shù)法,本文采用正態(tài)模糊數(shù)評價方法,通過概率密度曲線間接反映隸屬度大小(易昊旻等,2013).
設(shè)論域?yàn)镽+(正實(shí)數(shù)域)上的一個模糊數(shù),定義A~的隸屬函數(shù)為:μ A(x):R→$0,1],x∈R,正態(tài)模糊數(shù)隸屬函數(shù)μA(x)表示為:
式中,μ為實(shí)測數(shù)據(jù)的平均值,σ為實(shí)測數(shù)據(jù)的標(biāo)準(zhǔn)差.A~作為一個模糊數(shù)僅具有概念上的意義,無法直接參與運(yùn)算.實(shí)際應(yīng)用時,一般通過α—截集將模糊數(shù)轉(zhuǎn)化為一定置信度水平的區(qū)間數(shù).α—截集定義如下:
~∈F(U),對于任意α∈0,],記:(A~)αΔ AαΔ {μ|(μ)≥a}
一般而言,α取0.9是普遍可以接受的置信度水平(李如忠,2011),根據(jù)式(2)易求得區(qū)間數(shù)Aα:
然后計算一定置信度水平下區(qū)域重金屬的地累積指數(shù)區(qū)間數(shù),對地累積指數(shù)區(qū)間數(shù)進(jìn)行各污染等級的隸屬度計算,根據(jù)區(qū)間數(shù)對各污染程度等級的隸屬度,進(jìn)行加權(quán)求和得出該區(qū)間數(shù)的重金屬污染程度.對于既得的正態(tài)隸屬度曲線,通過求取定積分的方式來獲取研究區(qū)土壤重金屬不同污染等級的面積占比.
3.2.3 核密度估計模型
核密度估計作為非參數(shù)估計理論中的一個典型方法,該方法的特點(diǎn)在于對采樣點(diǎn)數(shù)據(jù)的分布形式不作任何假定,僅依賴于數(shù)據(jù)本身,是完全數(shù)據(jù)驅(qū)動下的密度函數(shù)的估計.因此在土壤重金屬數(shù)據(jù)的信息挖掘上有很強(qiáng)的適用性.
對于樣本數(shù)據(jù)x1,x2...xn,核密度估計公式為:
式中,K稱為核函數(shù),n是總體樣本數(shù),h為窗寬值或光滑系數(shù).
核函數(shù)為關(guān)于y軸對稱并且其積分為1的概率密度函數(shù),常用的核函數(shù)種類見表 1.根據(jù)以往學(xué)者的研究,不同核函數(shù)對結(jié)果的影響較小(郭照莊等,2008),本文選擇應(yīng)用較為廣泛的高斯核函數(shù)進(jìn)行研究.
表1 常見核函數(shù)類型
窗寬對核密度估計的結(jié)果十分重要,它的值如果過大,則核密度曲線會過于平滑,反之,則曲線會出現(xiàn)很嚴(yán)重的鋸齒.確定一個合理的窗寬值至關(guān)重要,最準(zhǔn)確和科學(xué)的方法是計算核估計式關(guān)于真實(shí)概率密度函數(shù)的均方誤差(MSE),但這種方法卻不能在實(shí)際研究中進(jìn)行應(yīng)用,因?yàn)槠溆玫搅讼闰?yàn)知識.以本文的研究為例,若研究區(qū)重金屬含量的概率密度分布真實(shí)值已經(jīng)掌握,就完全沒有進(jìn)行核估計的必要,因此,該方法僅僅具有理論上的意義.
在不需要先驗(yàn)知識的情況下,交叉驗(yàn)證法對樣本數(shù)在100~1000的范圍內(nèi)窗寬的選取精度較高(任溫軍和宋向東,2009),但容易陷入局部最優(yōu)化.為了避免這種影響,本文將交叉驗(yàn)證法所得窗寬值與實(shí)際應(yīng)用中的一個經(jīng)驗(yàn)值取平均,作為最終的窗寬值.公式(5)為交叉驗(yàn)證法選取窗寬的公式(吳喜之和趙博娟,2009):公式(6)為實(shí)際應(yīng)用中確定窗寬的經(jīng)驗(yàn)公式,公式(7)為最終的窗寬公式.
式中,f^-i(Xi)為刪去第i個觀測點(diǎn)之后得到的核密度估計.最優(yōu)窗寬值hcv等價于使函數(shù)值CV(h)最小.對于重金屬的核密度曲線,區(qū)域總體污染程度以及各個污染等級面積的比重,也運(yùn)用定積分來求取.
4 結(jié)果與討論
4.1 研究區(qū)土壤重金屬污染程度參照值的模擬
本文將采樣點(diǎn)數(shù)據(jù)進(jìn)行克里格插值后所得到的柵格數(shù)據(jù)作為參照值,雖然該參照值本質(zhì)上仍舊是離散的點(diǎn),其統(tǒng)計結(jié)果與真實(shí)值相比仍存在誤差,但可以參照該值來測算各評價方法結(jié)果的偏差.
對柵格圖進(jìn)行數(shù)據(jù)統(tǒng)計分析,可以得到表 2的數(shù)據(jù)作為評價的參照值.從表 2可以看出,參與統(tǒng)計的柵格圖像元值達(dá)到了50741個,數(shù)據(jù)量擴(kuò)大了218倍.統(tǒng)計分析可知,研究區(qū)As、Cd的平均地累積指數(shù)參照值分別為-0.56、0.26,總體污染程度分別是清潔和輕度污染.
表2 研究區(qū)土壤重金屬地累積指數(shù)參照值
4.2 基于地累積指數(shù)的區(qū)域土壤重金屬污染程度評價
采用地累積指數(shù)法,通過取平均值計算區(qū)域總體污染程度,再按照各個樣點(diǎn)的污染程度等級進(jìn)行簡單統(tǒng)計,得到各級別污染區(qū)域的面積占比.具體評價結(jié)果見表 3.從表 3結(jié)果可以看出,運(yùn)用單純地累積指數(shù)進(jìn)行評價偏差會較大,區(qū)域平均地累積指數(shù)相對于參照值的偏差分別為14.3%、19.2%.As在整個研究區(qū)的平均污染程度較低,總體污染程度評價結(jié)果偏低,各污染等級面積占比的偏差不大;各污染區(qū)域面積占比的偏差在Cd中體現(xiàn)較為明顯,重金屬污染評價結(jié)果偏高.總體上來看,運(yùn)用簡單統(tǒng)計所得到的結(jié)果偏差比較大,如何在評價模型上進(jìn)行一些改進(jìn)以減少這種偏差很有必要.
表3 基于簡單地累積統(tǒng)計法的研究區(qū)土壤As、Cd污染程度評價結(jié)果
4.3 基于模糊數(shù)法的區(qū)域土壤重金屬污染程度評價 4.3.1 評價的過程與結(jié)果
研究區(qū)重金屬的正態(tài)或?qū)?shù)正態(tài)分布特征是運(yùn)用正態(tài)模糊數(shù)法評價的前提條件和基礎(chǔ),進(jìn)行K-S檢驗(yàn),得到Cd的sig值為0.062,通過對As進(jìn)行兩次對數(shù)轉(zhuǎn)換,其sig值為0.107,Cd、As在0.05的顯著水平下分別服從正態(tài)、對數(shù)正態(tài)分布,即可對研究區(qū)進(jìn)行基于正態(tài)模糊數(shù)模型的As、Cd污染評價.
表4 基于正態(tài)模糊數(shù)的研究區(qū)土壤As、Cd污染程度評價結(jié)果
Cd計算得到標(biāo)準(zhǔn)化后清潔、輕度和中度污染面積占比分別是23.02%、71.96%、5.02%,偏差為+5.10%、-4.20%、-0.90%.與參照值相比,清潔區(qū)域面積占比有所提高,而輕度和中度污染的區(qū)域面積占比有不同幅度的下降,總體評價結(jié)果有一定程度偏低.As計算結(jié)果為歸一化后清潔、輕度和中度污染面積占比分別為99.81%、0.19%、0,清潔、清度污染的偏差分別為+0.11%、-0.11%.結(jié)合表 3的結(jié)果,該占比結(jié)果更加接近于參照值,說明對于占比十分微小的輕度污染面積占比,正態(tài)模糊數(shù)模型仍有一定的識別功能.
4.3.2 與傳統(tǒng)的線性模型評價結(jié)果的定量比較
基于模糊數(shù)模型的土壤重金屬污染程度評價,更多學(xué)者選擇的是線性模糊數(shù),其中的典型代表是三角模糊數(shù),本文運(yùn)用三角模糊數(shù)進(jìn)行研究區(qū)污染程度評價,并將其評價結(jié)果與正態(tài)模糊數(shù)的結(jié)果進(jìn)行定量比較.三角模糊數(shù)的原理、公式可參見相關(guān)文獻(xiàn)(李飛等,2012),截集α仍選擇0.9,計算結(jié)果見表 5.
表5 基于三角模糊數(shù)的研究區(qū)土壤As、Cd污染程度評價結(jié)果
從表 5可以看出,與正態(tài)型模糊數(shù)相比,三角模糊數(shù)的模糊地累積指數(shù)區(qū)間發(fā)生了正向偏移,使得評價地累積指數(shù)大于正態(tài)模型.結(jié)合參照值可知,這種正向偏移使As的偏差減小到10.54%,但使Cd的偏差大幅增加到52.42%,顯示出線性模糊數(shù)的評價結(jié)果具有較強(qiáng)的波動性.同時,從各等級污染區(qū)域占比看出,三角模糊數(shù)會使區(qū)間值范圍有所縮小.與參照值的各等級污染面積占比相比,As的輕度污染區(qū)域占比減小,而清潔區(qū)域占比增大;Cd的清潔區(qū)域和中度污染區(qū)域占比進(jìn)一步減小,而輕度污染區(qū)域占比增大,從而使其污染比重有所提高.因此,三角模糊數(shù)的評價結(jié)果較差.
4.4 基于核密度估計法的區(qū)域土壤重金屬污染程度評價
對核估計式繪圖得到As、Cd含量的概率密度曲線(圖 2),從曲線形狀可知,As含量的概率密度確實(shí)呈現(xiàn)一定程度的正偏態(tài),概率最高值出現(xiàn)在7.2 mg · kg-1,在其右側(cè)的最大值達(dá)到了12 mg · kg-1左右,而左側(cè)在5.5 mg · kg-1之下就出現(xiàn)幾率基本為0.計算后得到研究區(qū)As地累積指數(shù)平均值為-0.62,地累積指數(shù)的方差為0.24,說明核密度估計法能對區(qū)域As總體污染程度的準(zhǔn)確度評估方面有一定提高,并且運(yùn)用核密度估計后的數(shù)據(jù)的標(biāo)準(zhǔn)差也與參照值一致,反映了評估結(jié)果較為穩(wěn)定可靠.接下來再根據(jù)核密度估計曲線對As各個污染程度的面積比重進(jìn)行計算.計算結(jié)果為:清潔區(qū)域污染比重為99.87%,輕度污染區(qū)域的比重是0.13%.各級污染區(qū)域比重與模糊數(shù)法相比類似,而核估計法輕度污染區(qū)域的評估比重稍低,但也能較敏感的顯示占比很小的輕度污染區(qū)域.
圖2 As、Cd含量核密度估計曲線
Cd也存在一定程度的正偏態(tài),含量值絕大部分分布在0.1~0.25 mg · kg-1,其中概率密度最高的值在1.8 mg · kg-1左右.相較于As,Cd元素的曲線峰度也很大,含量值在0.01 mg · kg-1之前出現(xiàn)頻率基本為0,從0.1~0.2迅速上升至最高點(diǎn),再從0.2~0.26驟降至很低的概率密度值,這和As元素的階梯式下降有所不同.0.3~0.5 mg · kg-1高含量值區(qū)間有嚴(yán)重拖尾現(xiàn)象,該區(qū)間概率密度值均很低,這有可能是部分區(qū)域的人為污染造成.對Cd的總體污染水平進(jìn)行計算,得到研究區(qū)Cd地累積指數(shù)平均值為0.30,地累積指數(shù)的方差為0.36.最后對各個污染級別的面積占比進(jìn)行統(tǒng)計,清潔區(qū)域占比18.40%,輕度污染區(qū)域占比為70.96%,中度污染區(qū)域占比10.64%.與參照值相比,輕度與中度污染區(qū)域面積有5%左右的偏差,這可以解釋為核估計模型對稀少值的一種敏感性,即Cd曲線中區(qū)間$0.3~0.5]的點(diǎn)位稀少,通過評估,每個點(diǎn)位的出現(xiàn)都會使其附近值的出現(xiàn)幾率增加,反映在概率密度曲線上,就是連續(xù)不間斷的拖尾現(xiàn)象.
4.5 不同評價方法下區(qū)域土壤重金屬污染程度的綜合比較
本文采用不同方法對研究區(qū)As、Cd兩種土壤重金屬元素的污染程度進(jìn)行了污染評價.以地累積指數(shù)為污染指數(shù),分別采用了簡單數(shù)理統(tǒng)計、模糊數(shù)法以及核密度估計方法進(jìn)行了評價.3種方法從評價便捷性上是由易到難的,但運(yùn)用更為復(fù)雜的模型會提高評價結(jié)果的準(zhǔn)確度或全面性.相關(guān)評價結(jié)果見圖 3.
圖3(Fig.3)
圖3 As、Cd不同評價方法結(jié)果的綜合比較
從簡單數(shù)理統(tǒng)計上來說,評估的結(jié)果較為良好,準(zhǔn)確度和參照值相差不大,但是對各污染等級面積占比的測度不夠準(zhǔn)確,會遺漏研究區(qū)域分布極少的污染等級面積占比,這種情況在對As元素各污染級別的面積比重測算中有所體現(xiàn),即遺漏了面積占比極少量的輕度污染區(qū)域.而運(yùn)用模糊數(shù)與核估計模型進(jìn)行評估就能在一定程度上避免了這個問題.
模糊數(shù)模型與簡單數(shù)理統(tǒng)計的結(jié)果一致,原因在于模型的兩個重要參數(shù)——均值與標(biāo)準(zhǔn)差就是基于樣本數(shù)據(jù),故不能提高對總體污染程度評估的準(zhǔn)確度.但運(yùn)用正態(tài)模糊數(shù)法仍然有兩個優(yōu)點(diǎn):①通過隸屬度曲線能對各污染等級面積占比有比較準(zhǔn)確的測度,能較為敏感地統(tǒng)計出研究區(qū)域分布極少的污染等級面積占比;②也能在一定置信水平下用一個區(qū)間數(shù)來表征區(qū)域土壤重金屬總體污染程度,能更為全面地反映區(qū)域土壤重金屬污染程度,評價結(jié)果所涵蓋的信息更加全面.
核密度估計則突破了模糊數(shù)對分布條件的限制,對任何分布形式的數(shù)據(jù)均能統(tǒng)計出所有可能值的概率密度,并通過一定的公式轉(zhuǎn)化求得該重金屬的區(qū)域總體污染程度以及各污染級別面積占比.從圖 3的結(jié)果可知,評價結(jié)果的準(zhǔn)確度能在前兩種方法基礎(chǔ)上有一定提高,且從標(biāo)準(zhǔn)差上可以看出,很好的保持了樣本數(shù)據(jù)的穩(wěn)定性,因此,核估計的評價結(jié)果能更準(zhǔn)確地反映研究區(qū)土壤重金屬污染實(shí)際,但它有兩個缺點(diǎn):一是計算量比較大,手動計算起來很繁瑣,通常需要通過程序來支持運(yùn)算,可考慮借助軟件編程來實(shí)現(xiàn);二是窗寬值的大小對核估計的效果起著決定性作用,但是窗寬的合理估計值往往是較難確定的.核密度估計方法的模型架構(gòu)較為靈活多變,同時由于估計式可以依賴代碼程序?qū)崿F(xiàn),允許它的估計過程更為復(fù)雜,故有著很大的改造空間.比如王金然等(2005)運(yùn)用迭代算法對核函數(shù)模型進(jìn)行優(yōu)化,通過對核密度函數(shù)進(jìn)行迭代,進(jìn)一步提高區(qū)域土壤重金屬污染程度評價的準(zhǔn)確度,鑒于其運(yùn)算量在核密度估計的基礎(chǔ)上又有了數(shù)量級的增加,在較多指標(biāo)與樣本數(shù)的情況下評價效率會比較低,如何在保證準(zhǔn)確度的同時,提高核估計迭代式的評價效率是值得進(jìn)一步研究的問題.具體參見污水寶商城資料或http://www.northcarolinalenders.com更多相關(guān)技術(shù)文檔。
5 結(jié)論
區(qū)域土壤重金屬污染不同評價方法的結(jié)果有所不同,各方法在評價便捷性、結(jié)果的準(zhǔn)確度和包含信息的全面性方面也有所差異:
1)簡單數(shù)理統(tǒng)計評價便捷性最高,但結(jié)果準(zhǔn)確度較低,對各污染等級面積占比的測度不夠準(zhǔn)確,會遺漏研究區(qū)內(nèi)分布極少的污染等級面積占比,并且只能得出唯一值,結(jié)果所包含信息較少.
2)應(yīng)用正態(tài)模糊數(shù)法評價能通過隸屬度曲線能對各污染等級面積占比有比較準(zhǔn)確的測度,此外也能在一定置信水平下用一個區(qū)間數(shù)來表征區(qū)域土壤重金屬總體污染程度,評價結(jié)果所涵蓋的信息更加全面,結(jié)果所包含信息最多,但基于正態(tài)模糊數(shù)法與簡單數(shù)理統(tǒng)計的總體污染程度評價結(jié)果偏差一致,結(jié)果準(zhǔn)確度較低,并且正態(tài)模糊數(shù)法采用較為復(fù)雜的數(shù)學(xué)模型,評價便捷性遠(yuǎn)低于簡單數(shù)理統(tǒng)計.與正態(tài)模糊數(shù)法相比,三角模糊數(shù)法評價結(jié)果具有較強(qiáng)的波動性,評價結(jié)果較差.
3)核密度估計結(jié)果準(zhǔn)確度最高,該方法下研究區(qū)As和Cd總體污染評價的平均地累積指數(shù)相對于參照值的偏差僅分別為10.7%和15.4%,但是核密度估計模型計算最為復(fù)雜,需要通過程序來支持運(yùn)算,評價便捷性最差,并且只能得出唯一值,結(jié)果所包含信息較少.同時對核密度估計效果起著決定性作用的窗寬合理估計值往往是較難確定的,但由于其靈活多變模型架構(gòu)和計算可以依賴代碼程序?qū)崿F(xiàn)的特點(diǎn),核密度方法有著很大的改造空間.