申請(qǐng)日2014.01.09
公開(公告)日2014.04.16
IPC分類號(hào)G01N33/18
摘要
本發(fā)明公開一種基于極限學(xué)習(xí)機(jī)(ELM,Extreme Learning Machine)的工業(yè)污水化學(xué)需氧量(COD,Chemical Oxygen Demand)在線軟測(cè)量方法,其特征主要包括以下步驟:一、確定影響工業(yè)污水COD的六個(gè)變量(懸浮固體濃度、進(jìn)水COD、PH值、氨氮、溶解氧以及總磷);二、將影響工業(yè)污水COD的六個(gè)輔助變量作為ELM的輸入變量,COD作為ELM的預(yù)測(cè)輸出變量;三、確定ELM的隱層節(jié)點(diǎn)數(shù)和激勵(lì)函數(shù)并選取訓(xùn)練集和測(cè)試集;四、根據(jù)所確定的訓(xùn)練集建立ELM軟測(cè)量模型,并用測(cè)試集檢驗(yàn)?zāi)P偷挠行?五、ELM模型的輸出為工業(yè)污水COD。本發(fā)明通過(guò)軟測(cè)量達(dá)到工業(yè)污水在線軟測(cè)量的目的,具有運(yùn)行速度快,預(yù)測(cè)精度高的效果,同時(shí)取代傳統(tǒng)在線分析儀表,降低企業(yè)的投入及維修成本。
權(quán)利要求書
1.基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD(COD,Chemical Oxygen Demand)在線軟測(cè)量方法,其特征在于按如下步驟進(jìn)行:
步驟一:確定影響工業(yè)污水COD的六個(gè)變量(懸浮固體濃度、進(jìn)水COD、PH值、氨氮、溶解氧以及總磷),通過(guò)相應(yīng)的傳感器將六個(gè)變量的實(shí)時(shí)數(shù)據(jù)采集到上位機(jī);
步驟二:采樣數(shù)據(jù)的預(yù)處理,包括去除粗大誤差數(shù)據(jù),消除噪聲,進(jìn)行標(biāo)準(zhǔn)化處理,消除不同測(cè)量變量量綱的影響;
步驟三:軟測(cè)量模型極限學(xué)習(xí)機(jī)的隱層節(jié)點(diǎn)數(shù)、輸出層激活函數(shù)、激活函數(shù)等參數(shù)的確定;
步驟四:對(duì)于N個(gè)不同的樣本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]T∈Rm,極限學(xué)習(xí)機(jī)(ELM,Extreme Learning Machine)數(shù)學(xué)可以表示為:Hβ=T,其中N為樣本個(gè)數(shù),n為輸出矩陣維數(shù),m為輸出矩陣維數(shù),xi為輸入變量,ti為輸出層輸出變量,H為隱層輸出矩陣,β為隱層神經(jīng)元和輸出神經(jīng)元的連接權(quán)重矩陣,T輸出層輸出矩陣,通過(guò)求取Hβ=T的最小范數(shù)最小二乘解可以得到全局唯一最小值;
步驟五:利用訓(xùn)練好的模型來(lái)測(cè)量工業(yè)污水COD,通過(guò)平均絕對(duì)百分誤差(MAPE,Mean Absolute Percentage Error)、平均訓(xùn)練時(shí)間、擬合優(yōu)度(U,Goodness Of Fit)這三項(xiàng)性能指標(biāo)可以得出極限學(xué)習(xí)機(jī)的時(shí)效性、準(zhǔn)確性。
2.根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于步驟一中對(duì)影響工業(yè)COD六個(gè)變量的選取,從所有可能影響工業(yè)污水COD的變量中,通過(guò)分析求得懸浮固體濃度、進(jìn)水COD、PH值、氨氮、溶解氧以及總磷這個(gè)六個(gè)變量作為影響工業(yè)污水COD的六個(gè)變量。
3.根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方 法,其特征在于步驟三中對(duì)于N個(gè)不同樣本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]T∈Rm,因此極限學(xué)習(xí)機(jī)的數(shù)學(xué)模型可以表示為:
寫成矩陣形式可以表示為:Hβ=T,其中:
其中,H為隱層輸出矩陣,H的第i列是輸入變量x1,x2,...,xN映射到第i個(gè)隱層神經(jīng)元的輸出,wi為輸入層的權(quán)重,bi為隱層閾值,wi和bi不需要手動(dòng)調(diào)整并且還可以隨機(jī)賦值,β為輸出層的權(quán)重,T為輸出層輸出矩陣;
建立基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量模型,按照如下三步完成:
第一步:隨機(jī)生成輸入層權(quán)重wi和隱層閾值bi,i=1,...,N;
第二步:計(jì)算隱層輸出矩陣H;
第三步:計(jì)算輸出層權(quán)重β;
其中HT為矩陣隱層輸出矩陣H的轉(zhuǎn)置,為隱層輸出矩陣H的Moore-Penrose廣義逆矩陣,為一個(gè)小正數(shù)。
4.根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于第三步極限學(xué)習(xí)機(jī)的隱層節(jié)點(diǎn)數(shù)、激活函數(shù)的選取,由于工業(yè)污水COD在線軟測(cè)量是解決離子濃度的問(wèn)題,因此,輸出層激活函數(shù)確定為線 性函數(shù);對(duì)于隱層節(jié)點(diǎn)數(shù)的選擇,初始隱層節(jié)點(diǎn)數(shù)為4,然后每次增加一個(gè)節(jié)點(diǎn)并選取兩種不同的激活函數(shù)(Sigmoid函數(shù)和Radial basis函數(shù))進(jìn)行對(duì)比學(xué)習(xí),以訓(xùn)練樣本的均方根誤差為標(biāo)準(zhǔn),分析不同的隱層節(jié)點(diǎn)數(shù)及激活函數(shù)對(duì)測(cè)試精度的影響,通過(guò)交叉驗(yàn)證的方式,確定極限學(xué)習(xí)機(jī)的最佳組合參數(shù):隱層節(jié)點(diǎn)數(shù)為6,激活函數(shù)為Sigmoid函數(shù)。
5.根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于第四步訓(xùn)練數(shù)據(jù)的處理,將傳感器采集到的影響工業(yè)污水COD的六個(gè)變量分別分為訓(xùn)練數(shù)據(jù)和檢測(cè)數(shù)據(jù),先通過(guò)訓(xùn)練數(shù)據(jù)對(duì)極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后通過(guò)檢測(cè)數(shù)據(jù)了檢驗(yàn)極限學(xué)習(xí)機(jī)模型的正確性。
說(shuō)明書
基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法
技術(shù)領(lǐng)域
本發(fā)明屬于軟測(cè)量技術(shù)領(lǐng)域,具體涉及一種基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD(COD,Chemical Oxygen Demand)在線軟測(cè)量方法,用于實(shí)時(shí)在線監(jiān)測(cè)工業(yè)污水COD的濃度。
背景技術(shù)
當(dāng)前國(guó)家大力倡導(dǎo)節(jié)能減排,企業(yè)開始加強(qiáng)對(duì)工業(yè)污水質(zhì)量的實(shí)時(shí)監(jiān)控,以此根據(jù)當(dāng)前的污水狀態(tài)及時(shí)有效地調(diào)整流程工業(yè)的閉環(huán)控制,保證工業(yè)污水排放的標(biāo)準(zhǔn)。
為了對(duì)工業(yè)污水處理過(guò)程中水質(zhì)的主要指標(biāo)COD進(jìn)行實(shí)時(shí)監(jiān)測(cè)控制,國(guó)內(nèi)外開發(fā)出監(jiān)控儀表,對(duì)其進(jìn)行監(jiān)測(cè),價(jià)格昂貴,維修成本高,在線軟測(cè)量技術(shù)是隨著現(xiàn)代流程工業(yè)復(fù)雜化、智能化發(fā)展后的一大新型軟儀表,通過(guò)軟測(cè)量技術(shù)的思想,可根據(jù)現(xiàn)場(chǎng)即有設(shè)備監(jiān)測(cè)的數(shù)據(jù),采用數(shù)據(jù)驅(qū)動(dòng)的原理,融合構(gòu)建出對(duì)被測(cè)參數(shù)的預(yù)測(cè)模型,以此代替?zhèn)鹘y(tǒng)的硬件檢測(cè)的新方法,只需在現(xiàn)場(chǎng)將含有預(yù)測(cè)算法的微處理器與遠(yuǎn)程工控機(jī)進(jìn)行數(shù)據(jù)的傳輸、處理、分析及決策,就能得到對(duì)被測(cè)參數(shù)的估計(jì),既可降低成本,又能提高現(xiàn)場(chǎng)對(duì)檢測(cè)數(shù)據(jù)的分析能力。
因此,本發(fā)明利用軟測(cè)量方法,采用不同于傳統(tǒng)監(jiān)測(cè)儀表的方式,通過(guò)對(duì)其他易獲取的影響工業(yè)污水COD的指標(biāo)的間接檢測(cè),根據(jù)數(shù)據(jù)的驅(qū)動(dòng)原理,構(gòu)建預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)預(yù)測(cè)工業(yè)污水COD的監(jiān)測(cè),為現(xiàn)場(chǎng)監(jiān)控系統(tǒng)提供必要的數(shù)據(jù)處理和分析功能;另外,針對(duì)工業(yè)污水COD的時(shí)變、非線性特性,本發(fā)明所采用的極限學(xué)習(xí)機(jī)(ELM,Extreme Learning Machine)方法,相比于現(xiàn)有的前饋神經(jīng)網(wǎng)絡(luò),它具有高度容錯(cuò)、快速處理、逼近精度高、泛化能力強(qiáng)的特點(diǎn),更適 合非線性時(shí)變的系統(tǒng),所以本發(fā)明采用極限學(xué)習(xí)機(jī)的軟測(cè)量技術(shù),能夠?yàn)楣I(yè)污水COD的預(yù)測(cè)提供一種低成本的監(jiān)測(cè)方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,通過(guò)極限學(xué)習(xí)機(jī)模型能有效提高工業(yè)污水COD在線軟測(cè)量的時(shí)效性和準(zhǔn)確性。
本發(fā)明的技術(shù)方案如下:基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其關(guān)鍵在于按如下步驟進(jìn)行:
1、基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于按如下步驟進(jìn)行:
步驟一:確定影響工業(yè)污水COD的六個(gè)變量(懸浮固體濃度、進(jìn)水COD、PH值、氨氮、溶解氧以及總磷),通過(guò)相應(yīng)的傳感器將六個(gè)變量的實(shí)時(shí)數(shù)據(jù)采集到上位機(jī);
步驟二:采樣數(shù)據(jù)的預(yù)處理,包括去除粗大誤差數(shù)據(jù),消除噪聲,進(jìn)行標(biāo)準(zhǔn)化處理,消除不同測(cè)量變量量綱的影響;
步驟三:軟測(cè)量模型極限學(xué)習(xí)機(jī)的隱含層節(jié)點(diǎn)數(shù)、輸出層激活函數(shù)、激活函數(shù)等參數(shù)的確定;
步驟四:對(duì)于N個(gè)不同的樣本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]T∈Rm,極限學(xué)習(xí)機(jī)(ELM,Extreme Learning Machine)數(shù)學(xué)可以表示為:Hβ=T,其中N為樣本個(gè)數(shù),n為輸出矩陣維數(shù),m為輸出矩陣維數(shù),xi為輸入變量,ti為輸出層輸出變量,H為隱含層輸出矩陣,β為隱含層神經(jīng)元和輸出神經(jīng)元的連接權(quán)重矩陣,T輸出層輸出矩陣。通過(guò)求取Hβ=T的最小范數(shù)最小二乘解可以得到全局唯一最小值;
步驟五:利用訓(xùn)練好的模型來(lái)測(cè)量工業(yè)污水COD,通過(guò)平均絕對(duì)百分誤差(MAPE,Mean Absolute Percentage Error)、平均訓(xùn)練時(shí)間、擬合優(yōu)度(U,Goodness of Fit)這三項(xiàng)性能指標(biāo)可以得出極限學(xué)習(xí)機(jī)的時(shí)效性、準(zhǔn)確性。
2、根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于步驟一中對(duì)影響工業(yè)COD六個(gè)變量的選取,從所有可能影響工業(yè)污水COD的變量中,通過(guò)分析求得懸浮固體濃度、進(jìn)水COD、PH值、氨氮、溶解氧以及總磷這個(gè)六個(gè)變量作為影響工業(yè)污水COD的六個(gè)變量。
3、根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于步驟三中對(duì)于N個(gè)不同樣本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]T∈Rm,因此極限學(xué)習(xí)機(jī)的數(shù)學(xué)模型可以表示為:
寫成矩陣形式可以表示為:Hβ=T,其中:
其中,H為隱含層輸出矩陣,H的第i列是輸入變量x1,x2,...,xN映射到第i個(gè)隱含層神經(jīng)元的輸出,wi為輸入層的權(quán)重,bi為隱含層閾值,wi和bi不需要手動(dòng)調(diào)整并且還可以隨機(jī)賦值,β為輸出層的權(quán)重,T為輸出層輸出矩陣;
建立基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量模型,按照如下三步完成:
第一步:隨機(jī)生成輸入層權(quán)重wi和隱含層閾值bi,i=1,...,N;
第二步:計(jì)算隱含層輸出矩陣H;
第三步:計(jì)算輸出層權(quán)重β;
其中HT為矩陣隱含層輸出矩陣H的轉(zhuǎn)置,為隱含層輸出矩陣H的Moore-Penrose廣義逆矩陣,為一個(gè)小正數(shù)。
4、根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于第三步極限學(xué)習(xí)機(jī)的隱含層節(jié)點(diǎn)數(shù)、激活函數(shù)的選取,由于工業(yè)污水COD在線軟測(cè)量是解決離子濃度的問(wèn)題,因此,輸出層激活函數(shù)確定為線性函數(shù);對(duì)于隱含層節(jié)點(diǎn)數(shù)的選擇,初始隱含層節(jié)點(diǎn)數(shù)為4,然后每次增加一個(gè)節(jié)點(diǎn)并選取兩種不同的激活函數(shù)(Sigmoid函數(shù)和Radial basis函數(shù))進(jìn)行對(duì)比學(xué)習(xí),以訓(xùn)練樣本的均方根誤差為標(biāo)準(zhǔn),分析不同的隱含層節(jié)點(diǎn)數(shù)及激活函數(shù)對(duì)測(cè)試精度的影響,通過(guò)交叉驗(yàn)證的方式,確定極限學(xué)習(xí)機(jī)的最佳組合參數(shù)為:隱含層節(jié)點(diǎn)數(shù)為6,激活函數(shù)為Sigmoid函數(shù)。
5、根據(jù)權(quán)利要求1所述的基于極限學(xué)習(xí)機(jī)的工業(yè)污水COD在線軟測(cè)量方法,其特征在于第四步訓(xùn)練數(shù)據(jù)的處理,將傳感器采集到的影響工業(yè)污水COD的六個(gè)變量分別分為訓(xùn)練數(shù)據(jù)和檢測(cè)數(shù)據(jù),先通過(guò)訓(xùn)練數(shù)據(jù)對(duì)極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后通過(guò)檢測(cè)數(shù)據(jù)了檢驗(yàn)極限學(xué)習(xí)機(jī)模型的正確性。
步驟六:通過(guò)以下三項(xiàng)性能指標(biāo)可以得出極限學(xué)習(xí)機(jī)的很高的時(shí)效性和準(zhǔn)確性,通過(guò)試驗(yàn)測(cè)得基于極限學(xué)習(xí)機(jī)理論的工業(yè)污水COD在線軟測(cè)量方法耗時(shí)為0.00321秒,擬合優(yōu)度U為0.9311,平均覺得百分誤差MAPE為0.0689。
本發(fā)明的顯著效果:通過(guò)對(duì)影響工業(yè)污水COD的六個(gè)變量的數(shù)據(jù)采集,利用極限學(xué)習(xí)機(jī)實(shí)現(xiàn)對(duì)工業(yè)污水COD濃度的在線軟測(cè)量,所得預(yù)測(cè)結(jié)果的精度較高、計(jì)算時(shí)間短,解決了現(xiàn)場(chǎng)的在線分析儀表價(jià)格昂貴、維修成本高的問(wèn)題,同時(shí)這種技術(shù)可推廣到現(xiàn)場(chǎng)其他難以直接測(cè)量的變量,為其他現(xiàn)場(chǎng)數(shù)據(jù)的分析及監(jiān)控提供一種有效的方法。