BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈污水處理廠脫氮效果模擬預(yù)測(cè)
中國(guó)污水處理工程網(wǎng) 時(shí)間:2016-4-30 8:12:50
污水處理技術(shù) | 匯聚全球環(huán)保力量,降低企業(yè)治污成本
1 引言
通過數(shù)學(xué)模型對(duì)污水處理的生化過程進(jìn)行模擬分析一直是污水處理運(yùn)行與管理領(lǐng)域的研究熱點(diǎn).20 世紀(jì) 50 年代以來,國(guó)外一些學(xué)者把反映生化過程機(jī)理的微生物生長(zhǎng)動(dòng)力學(xué)引入污水處理領(lǐng)域.20世紀(jì) 80年代末,國(guó)際水協(xié)會(huì)(IWA)提出的活性污泥 1號(hào)模型(ASM1,Activated Sludge Model No. 1)取得了很大的成功,是早期較為完善的污水處理數(shù)學(xué)模型研究之一.通過模擬計(jì)算,使污水處理的設(shè)計(jì)和運(yùn)行更加理論化和系統(tǒng)化,提高了人們對(duì)污水生物處理過程的認(rèn)識(shí),不僅節(jié)省了大量的經(jīng)濟(jì)成本,而且提高了污水處理相關(guān)工作的質(zhì)量和效率.
然而,隨著污水處理工藝及設(shè)備設(shè)施的日漸復(fù)雜,活性污泥數(shù)學(xué)模型在污水處理廠的實(shí)際應(yīng)用中具有一定的局限性.一方面,數(shù)學(xué)模型的建立過程比較復(fù)雜,需要對(duì)水質(zhì)組分及動(dòng)力學(xué)參數(shù)進(jìn)行測(cè)定,大部分污水廠缺乏這方面的基礎(chǔ)有效數(shù)據(jù);另一方面,污水處理過程實(shí)際上是一個(gè)十分復(fù)雜的由物理、生物、化學(xué)等因素協(xié)同作用的過程,最終的處理效果不僅與決定其生物反應(yīng)的一系列特征相關(guān),同時(shí)還受大量不確定因素的影響,而活性污泥數(shù)學(xué)模型還遠(yuǎn)未將這些因素考慮在內(nèi),這在一定程度上降低了模型預(yù)測(cè)的精確性和實(shí)際應(yīng)用價(jià)值.
對(duì)此,筆者提出可通過基于數(shù)據(jù)驅(qū)動(dòng)的黑箱模型對(duì)污水廠處理效果進(jìn)行模擬預(yù)測(cè).然而污水處理過程中去除污染物的種類很多,每種類型污染物都有其獨(dú)特的去除機(jī)理和影響因素,因此,僅通過建立一個(gè)黑箱模型就對(duì)所有指標(biāo)進(jìn)行預(yù)測(cè)勢(shì)必?zé)o法保證準(zhǔn)確性.綜合考慮,本研究將黑箱模型主要用于污水處理脫氮工藝模擬分析,主要基于以下幾方面原因:①污水廠出水總氮是評(píng)判其工藝水平和運(yùn)行水平的重要指標(biāo)之一,對(duì)于一般水廠而言要保持出水總氮平穩(wěn)達(dá)標(biāo),存在一定的技術(shù)難度和較大的調(diào)控空間;②對(duì)于傳統(tǒng)反硝化脫氮的機(jī)理及影響因素已研究的較為透徹,因此,可以很好地確定對(duì)脫氮效果有顯著影響的參數(shù),同時(shí)這些參數(shù)在一般污水廠都有大量的實(shí)際數(shù)據(jù);③隨著未來污水處理標(biāo)準(zhǔn)的日益提高,如何能保障前端脫氮效果,對(duì)后續(xù)深度處理工藝的成本控制有重要影響.
基于此,本文采用BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的組合預(yù)測(cè)模型,首先通過BP神經(jīng)網(wǎng)絡(luò)模型對(duì)北京某大型污水處理廠實(shí)際進(jìn)出水?dāng)?shù)據(jù)和工藝參數(shù)進(jìn)行粗略擬合;其次,利用馬爾可夫鏈對(duì)擬合結(jié)果及誤差進(jìn)行狀態(tài)劃分以進(jìn)一步提高預(yù)測(cè)精確度;最后,運(yùn)用基于BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的組合模型預(yù)測(cè)分析該廠的實(shí)際出水水質(zhì).
2 BP神經(jīng)網(wǎng)絡(luò)和馬爾可夫鏈模型的構(gòu)建
2.1 BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
神經(jīng)網(wǎng)絡(luò)模型是以神經(jīng)元的數(shù)學(xué)模型為基礎(chǔ)來描述的,是一種按誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),它由網(wǎng)絡(luò)拓?fù)、?jié)點(diǎn)特點(diǎn)和學(xué)習(xí)規(guī)則來表示,能在未知被構(gòu)建對(duì)象和輸入?yún)?shù)的數(shù)學(xué)關(guān)系式的情況下,通過學(xué)習(xí)和貯存大量的輸入-輸出模式關(guān)系,自適應(yīng)地獲取輸入與輸出的非線性映射關(guān)系.這其中又屬BP 神經(jīng)網(wǎng)絡(luò)的應(yīng)用最為普遍,它使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小.應(yīng)用 BP 神經(jīng)網(wǎng)絡(luò)一般包括4個(gè)基本步驟:①確定網(wǎng)絡(luò)結(jié)構(gòu)形式;②收集訓(xùn)練和測(cè)試樣本;③進(jìn)行網(wǎng)絡(luò)模型訓(xùn)練;④利用訓(xùn)練后的網(wǎng)絡(luò)進(jìn)行應(yīng)用計(jì)算.
神經(jīng)網(wǎng)絡(luò)模型的模擬過程中會(huì)應(yīng)用到大量的樣本訓(xùn)練和測(cè)試數(shù)據(jù),一般污水廠生產(chǎn)運(yùn)行過程中會(huì)產(chǎn)生大量數(shù)據(jù),但這些數(shù)據(jù)大部分是由人工或儀表檢測(cè)而來,受取樣、化驗(yàn)操作、瞬時(shí)波動(dòng)、儀表等因素影響,這些數(shù)據(jù)經(jīng)常存在誤差和波動(dòng).用這樣的數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,往往會(huì)導(dǎo)致預(yù)測(cè)結(jié)果在一定范圍內(nèi)隨機(jī)波動(dòng),降低了預(yù)測(cè)的準(zhǔn)確性.馬爾可夫鏈恰能有效地預(yù)見并消除由系統(tǒng)隨機(jī)性而產(chǎn)生的預(yù)測(cè)誤差.因此,通過建立神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的組合預(yù)測(cè)模型,將二者進(jìn)行優(yōu)勢(shì)互補(bǔ),能夠得到更為準(zhǔn)確的預(yù)測(cè)結(jié)論
2.2 馬爾可夫鏈模型構(gòu)建
馬爾可夫鏈?zhǔn)歉鶕?jù)俄國(guó)數(shù)學(xué)家馬爾可夫發(fā)現(xiàn)的系統(tǒng)狀態(tài)轉(zhuǎn)移規(guī)律,分析隨機(jī)事件未來發(fā)展趨勢(shì)及可能結(jié)果的一種預(yù)測(cè)方法其實(shí)質(zhì)是對(duì)于事件發(fā)生的概率進(jìn)行預(yù)測(cè),根據(jù)目前狀況來預(yù)測(cè)其將來時(shí)刻變動(dòng)狀況.馬爾可夫鏈預(yù)測(cè)主要分兩個(gè)過程:一是確定馬爾可夫鏈的狀態(tài)空間;二是要通過計(jì)算確定狀態(tài)轉(zhuǎn)移概率與狀態(tài)轉(zhuǎn)移矩陣.
在事件發(fā)展變化過程中,狀態(tài)Ei經(jīng)過k步轉(zhuǎn)移到狀態(tài)Ej的轉(zhuǎn)移概率Pkij為:
式中,Mi表示狀態(tài)Ei出現(xiàn)的總次數(shù),mkij表示狀態(tài)Ei經(jīng)k步轉(zhuǎn)移到狀態(tài)Ej的次數(shù),m為劃分的狀態(tài)數(shù)目.
對(duì)于BP神經(jīng)網(wǎng)絡(luò)模擬預(yù)測(cè)的結(jié)果,通過馬爾可夫鏈模型可以分析其誤差的波動(dòng)范圍,并且預(yù)測(cè)波動(dòng)的發(fā)展趨勢(shì),通過誤差的狀態(tài)轉(zhuǎn)移概率矩陣對(duì)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的結(jié)果進(jìn)行進(jìn)一步的精細(xì)優(yōu)化.馬爾可夫鏈?zhǔn)且粋(gè)典型的無后效應(yīng)隨機(jī)過程,即模型在時(shí)刻t的狀態(tài)只與它的前一個(gè)時(shí)刻t-1的狀態(tài)條件相關(guān),與以前的狀態(tài)條件獨(dú)立.
在污水處理過程中,下一時(shí)刻污染物濃度變化情況只與當(dāng)前時(shí)期(8~12 h)的系統(tǒng)狀態(tài)有關(guān),而與之前的狀態(tài)無關(guān).此外,該模型的最終預(yù)測(cè)結(jié)果不是一個(gè)具體數(shù)值,而是生成一組不同概率的預(yù)測(cè)區(qū)間值,該方法可從一定程度上彌補(bǔ)因化驗(yàn)產(chǎn)生的數(shù)值誤差,提高預(yù)測(cè)準(zhǔn)確度.
3 污水處理廠脫氮效果模擬預(yù)測(cè)分析
本文采用北京某大型污水處理廠的實(shí)際生產(chǎn)數(shù)據(jù)為實(shí)驗(yàn)依據(jù),該廠設(shè)計(jì)日處理規(guī)模100萬m3 · d-1,其主體工藝采用A/O法去除有機(jī)污染物(COD)和總氮(TN),同時(shí)還通過投加化學(xué)藥劑來去除總磷(TP),最終出水主要指標(biāo)可穩(wěn)定達(dá)到《城鎮(zhèn)水污染物排放標(biāo)準(zhǔn)》(GB18918)中的一級(jí)B標(biāo)準(zhǔn).
由于污水處理過程中每種類型污染物的去除都有其各自的原理和特點(diǎn),因此,其影響因素也各不相同.例如,對(duì)于BOD、COD等有機(jī)指標(biāo),一般水廠均能較徹底的去除,其出水的殘留值主要與原水中的溶解性不可降解有機(jī)物有關(guān).再例如懸浮物指標(biāo),主要與沉淀單元的水力負(fù)荷和狀態(tài)點(diǎn)有關(guān),而與其它水質(zhì)指標(biāo)關(guān)聯(lián)不大,等等.其中,總氮是污水中的主要污染物之一,其去除機(jī)理和影響因素目前研究的較為明確,因此,本文主要以脫氮工藝模擬為研究對(duì)象,對(duì)該廠出水總氮進(jìn)行數(shù)學(xué)模擬分析.
3.1 基于BP神經(jīng)網(wǎng)絡(luò)的污水廠脫氮效果模擬
以該廠2013年全年數(shù)據(jù)為基礎(chǔ),共收集了365組樣本集,其中250組作為訓(xùn)練集,115組作為測(cè)試集.試驗(yàn)工具采用新西蘭懷卡托大學(xué)開發(fā)的WEKA數(shù)據(jù)挖掘應(yīng)用平臺(tái),BP神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為 8,分別表示進(jìn)水流量、生物反應(yīng)池溫度、進(jìn)水BOD、進(jìn)水COD、進(jìn)水TN濃度、進(jìn)水NH+4-N濃度、生物反應(yīng)池MLSS濃度、生物反應(yīng)池MLVSS濃度;輸出層節(jié)點(diǎn)為出水TN濃度,隱藏層數(shù)取1,迭代次數(shù)為500,采用不同的隱含層節(jié)點(diǎn)數(shù)分別對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,當(dāng)隱含層節(jié)點(diǎn)數(shù)取4時(shí),神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差最低(平均誤差0.073).利用訓(xùn)練后的模型,以2013年各月的月均參數(shù)值為輸入量(表 1),模擬各月月均TN值,模擬結(jié)果與真實(shí)值的線性相關(guān)度為0.921(圖 1).
北京某污水處理廠2013年1—12月主要運(yùn)行數(shù)據(jù)
圖1 神經(jīng)網(wǎng)絡(luò)模型擬合結(jié)果
利用訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對(duì)該廠2014年1—12月數(shù)據(jù)進(jìn)行模擬預(yù)測(cè),最終模擬值與實(shí)際值對(duì)比情況如圖 2和表 2所示.從表 2可以看出,12個(gè)月的數(shù)據(jù)模擬誤差范圍為±10%,有3次模擬結(jié)果低于實(shí)際值,9次高于實(shí)際值.其中,最小誤差為0.79%,最大誤差為9.49%.
表2 污水處理廠實(shí)際出水水質(zhì)及BP網(wǎng)絡(luò)計(jì)算擬合值
3.2 基于馬爾可夫鏈的預(yù)測(cè)結(jié)果修正模型 3.2.1 馬爾可夫狀態(tài)區(qū)域劃分
馬爾可夫鏈的預(yù)測(cè)精度主要由轉(zhuǎn)移矩陣決定,為了構(gòu)造轉(zhuǎn)移矩陣,首先需要合理劃分誤差狀態(tài)區(qū)間,一般以樣本-均方差方法來確定.以樣本的均值 為中心,標(biāo)準(zhǔn)差s=
為標(biāo)準(zhǔn)進(jìn)行分組.一般可將數(shù)據(jù)序列分為:(x-s,x-0.5s)、(x-0.5s,x+0.5s)、(x+0.5s,x+s)等幾組.
從表 2可以看出,模擬值與實(shí)際值誤差在-10%~5%之間,誤差平均值為x=-2.5,標(biāo)準(zhǔn)差為s=4.28.根據(jù)均值-標(biāo)準(zhǔn)差分級(jí)方法,通過BP模擬結(jié)果的誤差均值和標(biāo)準(zhǔn)差,可將馬爾可夫狀態(tài)區(qū)域劃分為4種狀態(tài):a[-10%,-5%],b[-5%,0],c[0,+5%],d[5%,10%]
3.2.2 污水廠出水總氮BP擬合結(jié)果一步轉(zhuǎn)移概率矩陣
對(duì)于馬爾可夫鏈,描述其概率性質(zhì)的重要的量是轉(zhuǎn)移概率矩陣.把轉(zhuǎn)移概率Pij=(n,n+k)記為Pij,當(dāng)k=1時(shí),Pij(1)稱為1步轉(zhuǎn)移概率,記為Pij.設(shè) P 表示一步轉(zhuǎn)移概率Pij(k)所組成的矩陣(式(2)),且狀態(tài)空間E={1,2,…,n},則 P 稱為系統(tǒng)狀態(tài)的一步轉(zhuǎn)移概率矩陣.
根據(jù)之前的3種區(qū)域狀態(tài)劃分,pij為由狀態(tài)i轉(zhuǎn)向狀態(tài)j的頻數(shù),如pab表示當(dāng)前誤差在a狀態(tài),下一組模擬誤差在b狀態(tài)的頻數(shù),其余以此類推.設(shè):
那么由狀態(tài)i轉(zhuǎn)向狀態(tài)j的轉(zhuǎn)移概率為fij≈pij/pi,(i=1,2,…,n),這樣便可得到BP模擬出水TN誤差的一步轉(zhuǎn)移概率矩陣,具體如表 3和式(3)所示.
表3 污水處理廠出水水質(zhì)預(yù)測(cè)結(jié)果的馬爾可夫狀態(tài)轉(zhuǎn)移表
3.2.3 馬氏性檢驗(yàn)
檢驗(yàn)隨機(jī)過程是否具有馬氏性是應(yīng)用馬爾科夫鏈模型的必要前提,通常離散序列的馬爾科夫鏈?zhǔn)怯忙? 統(tǒng)計(jì)量來檢驗(yàn)的.
j表示(nij)q×q的第j列之和同各行各列的總和的比值,Pij表示狀態(tài)i轉(zhuǎn)到狀態(tài)j的概率,計(jì)算公式如下:
統(tǒng)計(jì)量服從自由度為(q-1)2的χ2分布.選定置信度α,查表得χ2α((q-1))2,令:
若χ2>χ2α((q-1))2,則{ri,i=T}具有馬氏性.對(duì)該廠12個(gè)月的狀態(tài)序列做馬氏檢驗(yàn).根據(jù)表 3再結(jié)合步長(zhǎng)為1的一步轉(zhuǎn)移概率矩陣 P,可算得統(tǒng)計(jì)量χ2=32.14,給定置信度α=0.05,查表可得分為點(diǎn)χ2a(4)=27.85.由于χ2>χ2α((q-1))2,故這組序列滿足馬氏性.
3.2.4 2015年1—5月出水總氮預(yù)測(cè)
根據(jù)2014年1—12月模擬結(jié)果,通過馬爾可夫鏈預(yù)測(cè)模型,得到2015年1—5月出水總氮狀態(tài)轉(zhuǎn)移表,結(jié)果如表 4所示.其中,參考2014年12月的模擬誤差,初始向量為[0.17,0.33,0.33,0.17].
表4 2015年1—5月出水TN預(yù)測(cè)狀態(tài)向量
綜上,得出2015年1—5月出水的最終預(yù)測(cè)結(jié)果(表 5).馬爾可夫鏈改進(jìn)后的預(yù)測(cè)結(jié)果是不通過概率下的區(qū)間范圍值,符合污水廠出水水質(zhì)和檢測(cè)結(jié)果在一定程度呈隨機(jī)變化的特性,通過最大概率區(qū)間預(yù)測(cè)值可以很準(zhǔn)確地預(yù)測(cè)實(shí)際出水水質(zhì)范圍.從該廠2015年1—5月的模擬預(yù)測(cè)結(jié)果可知,出水的實(shí)際水質(zhì)均符合最大概率區(qū)間內(nèi)的預(yù)測(cè)范圍值,表明基于 BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的組合預(yù)測(cè)模型具有較高的精度,可應(yīng)用于污水處理的水質(zhì)模擬.
4 結(jié)論
1)污水處理過程是多種復(fù)雜生物化學(xué)反應(yīng)綜合作用的結(jié)果.本文所采用的模擬方法和預(yù)測(cè)模型是對(duì)傳統(tǒng)污水處理數(shù)學(xué)模型的一種補(bǔ)充,即通過數(shù)據(jù)挖掘手段,采用基于BP 神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的組合預(yù)測(cè)模型,充分挖掘出數(shù)據(jù)中的變化規(guī)律與擬合趨勢(shì),恰好彌補(bǔ)了傳統(tǒng)數(shù)學(xué)模型的不足.
2)通過對(duì)北京某污水處理廠實(shí)際數(shù)據(jù)分析計(jì)算表明,BP神經(jīng)網(wǎng)絡(luò)模型結(jié)合馬爾可夫鏈組合模型具有很好的適用性,能夠準(zhǔn)確預(yù)測(cè)出水水質(zhì)范圍.在不掌握生物反應(yīng)機(jī)理模型參數(shù)或缺乏數(shù)據(jù)的情況下,為污水處理廠水質(zhì)模擬提供了一種新的途徑.具體參見污水寶商城資料或http://www.northcarolinalenders.com更多相關(guān)技術(shù)文檔。
3)本方法尤其適合于運(yùn)行工藝和進(jìn)出水水質(zhì)相對(duì)穩(wěn)定,且具有大量歷史數(shù)據(jù)積累的水廠.由于污水處理過程影響因素的多樣性和不確定性,對(duì)于不同類型的水廠,在具體建模時(shí)還應(yīng)結(jié)合實(shí)際情況,在神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)(即污水處理的影響因素)選取和馬爾可夫狀態(tài)區(qū)域劃分方面進(jìn)一步研究分析.