大數(shù)據(jù)時(shí)代火電廠的數(shù)據(jù)價(jià)值
隨著近幾年互聯(lián)網(wǎng)的飛速發(fā)展和普及,數(shù)據(jù)呈持續(xù)性爆發(fā)增長,“大數(shù)據(jù)”時(shí)代的腳步已悄然而至。而傳統(tǒng)的火力發(fā)電廠也正逐步向數(shù)字化電廠邁進(jìn),各種數(shù)字化儀表與設(shè)備已取代原有的機(jī)械式儀表與設(shè)備,DCS、SIS乃至ERP等系統(tǒng)也已在各個(gè)電廠普及。各類傳感設(shè)備、移動(dòng)終端、數(shù)據(jù)采集設(shè)備等產(chǎn)生的大量數(shù)據(jù)被保存、分析,用于指導(dǎo)火力發(fā)電廠的生產(chǎn)運(yùn)營??梢姡鹆Πl(fā)電廠在向數(shù)字化電廠邁進(jìn)的過程中,已經(jīng)感受到“大數(shù)據(jù)”對(duì)企業(yè)管理與運(yùn)營帶來的沖擊。
1、面臨的問題
數(shù)據(jù)的存儲(chǔ)與保存,在信息技術(shù)日新月異的今天已不成問題,但對(duì)數(shù)據(jù)的分析應(yīng)用乃至數(shù)據(jù)價(jià)值的深度挖掘卻依然是擺在各個(gè)火力發(fā)電企業(yè)面前的難題。導(dǎo)致企業(yè)海量數(shù)據(jù)無法體現(xiàn)其深層價(jià)值的原因有3個(gè)方面:
1)不重視數(shù)據(jù)價(jià)值的挖掘。用平面、離散的眼光來看待數(shù)據(jù),滿足于各類生產(chǎn)實(shí)時(shí)數(shù)據(jù)的查看、統(tǒng)計(jì)報(bào)表的生成,沒有重視數(shù)據(jù)間關(guān)系的分析及各類相關(guān)數(shù)據(jù)間的時(shí)間特性。
2)缺乏數(shù)據(jù)價(jià)值挖掘的長效機(jī)制。數(shù)據(jù)價(jià)值的深度挖掘,依靠數(shù)據(jù)分析模型逐步建立。如果沒有對(duì)數(shù)據(jù)的長期分析跟蹤,就不可能找到有效的分析模型。
3)缺乏專業(yè)知識(shí)高度融合的復(fù)合型人才。對(duì)數(shù)據(jù)進(jìn)行分析,不僅需要具備火力發(fā)電廠的相關(guān)知識(shí),也需要掌握足夠的計(jì)算機(jī)專業(yè)知識(shí),尤其是對(duì)各類數(shù)據(jù)庫的理解與對(duì)結(jié)構(gòu)化查詢語句的熟練掌握。
2、火力發(fā)電廠的數(shù)據(jù)分析
數(shù)據(jù)在火力發(fā)電廠主要存在以下3類:第一類結(jié)構(gòu)化數(shù)據(jù)。直接展現(xiàn)企業(yè)生產(chǎn)一線各種信息,數(shù)據(jù)價(jià)值密度高,由于其有嚴(yán)格的數(shù)據(jù)類型、標(biāo)準(zhǔn)的查詢語言等特點(diǎn),易于挖掘出更高的數(shù)據(jù)價(jià)值。第二類非結(jié)構(gòu)化數(shù)據(jù)。不是生產(chǎn)一線數(shù)據(jù),但往往與企業(yè)管理契合度較高,數(shù)據(jù)價(jià)值密度中等,數(shù)據(jù)價(jià)值挖掘難度較大;第三類,多媒體數(shù)據(jù)。大部分對(duì)生產(chǎn)而言價(jià)值較小,但對(duì)于事故的視頻回放分析有很高的價(jià)值,所以其數(shù)據(jù)價(jià)值密度低,但數(shù)據(jù)價(jià)值挖掘難度大。
數(shù)據(jù)價(jià)值除了極少能直觀表現(xiàn)出來,更多則隱含在枯燥數(shù)字的背后。在火力發(fā)電廠內(nèi),廠用電率指標(biāo)的高低可以直接從指標(biāo)信息中獲得,是直觀表現(xiàn)出來的,而導(dǎo)致廠用電率升高或降低的原因卻隱藏在看似雜亂無章的數(shù)據(jù)洪流背后。對(duì)數(shù)據(jù)的分析越深入,就能獲得越多的數(shù)據(jù)價(jià)值,分析后取得的數(shù)據(jù)價(jià)值密度要遠(yuǎn)遠(yuǎn)高于原始數(shù)據(jù)的價(jià)值密度。
數(shù)據(jù)的相關(guān)性分析是獲得隱含數(shù)據(jù)價(jià)值的高效方式。數(shù)據(jù)可以存儲(chǔ)在不同的數(shù)據(jù)庫、不同的數(shù)據(jù)文件、不同的表空間、不同的表中,但是物理上的分離并不代表這些數(shù)據(jù)在邏輯上也是隔離的,在邏輯上這些數(shù)據(jù)恰恰是高度相關(guān)的。所以對(duì)數(shù)據(jù)價(jià)值的分析,必須將各相關(guān)數(shù)據(jù)看作一個(gè)整體,進(jìn)行各數(shù)據(jù)間的相關(guān)性分級(jí),然后建立模型。例如電廠廠用電率指標(biāo)與各主要輔機(jī)耗電量有關(guān),各輔機(jī)設(shè)備耗電量又與單臺(tái)輔機(jī)的各項(xiàng)運(yùn)行指標(biāo)有關(guān),任何一個(gè)指標(biāo)的變動(dòng)都會(huì)導(dǎo)致廠用電率改變。相關(guān)性分析就如同將廠用電率當(dāng)作一個(gè)生命體,而輔機(jī)指標(biāo)等相關(guān)數(shù)據(jù)集作為這個(gè)生命體的體征指標(biāo),用來衡量這個(gè)生命體的健康程度。
3、火力發(fā)電廠的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘是伴隨著數(shù)據(jù)的急速膨脹而發(fā)展起來的技術(shù),沒有數(shù)據(jù)挖掘技術(shù),就不會(huì)在海量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)的價(jià)值。伴隨著“大數(shù)據(jù)”時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)必將越來越重要。
數(shù)據(jù)挖掘不同于傳統(tǒng)的數(shù)據(jù)分析(查詢、報(bào)表等),數(shù)據(jù)挖掘可以得到有效可用且先前未知的信息,是不能靠直覺發(fā)現(xiàn)信息或知識(shí)的,甚至挖掘出的是出乎意料的信息。例如在美國某超市內(nèi),經(jīng)過數(shù)據(jù)挖掘發(fā)現(xiàn),購買嬰兒尿布的男性有30%~40%會(huì)順便購買啤酒,依據(jù)這一信息,超市將嬰兒用品與男士用品靠近擺放,結(jié)果這個(gè)變動(dòng)讓此類商品的銷售量成倍增長??梢姡瑪?shù)據(jù)挖掘能發(fā)現(xiàn)有預(yù)見性的信息與知識(shí)。
數(shù)據(jù)挖掘的方法主要有神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、決策樹方法、粗集方法等。在火力發(fā)電廠數(shù)據(jù)挖掘中,神經(jīng)網(wǎng)絡(luò)方法由于本身有良好的魯棒性、自組織自適應(yīng)性、并行處理、分布存儲(chǔ)和高度容錯(cuò)等特性,非常適合解決數(shù)據(jù)挖掘的問題,因此被普遍采用。數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類分析、分類、預(yù)測(cè)、時(shí)序模式和偏差分析等。只有完成這些才可以發(fā)現(xiàn)數(shù)據(jù)價(jià)值。一般用支持度和可信度2個(gè)閾值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,同時(shí)不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。
數(shù)據(jù)價(jià)值挖掘貫穿于企業(yè)信息化過程的整個(gè)生命周期。數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)價(jià)值挖掘重要的方法。在數(shù)據(jù)價(jià)值挖掘中,必須重視企業(yè)所有原始數(shù)據(jù)的建模,盡量使得用于數(shù)據(jù)挖掘的數(shù)據(jù)條理清楚、關(guān)聯(lián)清晰,盡可能結(jié)構(gòu)化。可見,數(shù)據(jù)價(jià)值挖掘必須有配套的數(shù)據(jù)整體規(guī)劃制度,將數(shù)據(jù)價(jià)值挖掘的思想貫穿于任何一個(gè)應(yīng)用開發(fā)的整個(gè)生命周期,否則數(shù)據(jù)挖掘所取得的價(jià)值會(huì)大打折扣,難度也會(huì)成倍增加??梢哉f,企業(yè)信息化初期的規(guī)劃、數(shù)據(jù)庫的建模等決定了數(shù)據(jù)挖掘所能取得的知識(shí)和信息的多少。
在“大數(shù)據(jù)”時(shí)代,火力發(fā)電廠所產(chǎn)生的數(shù)據(jù)僅僅是整個(gè)社會(huì)數(shù)據(jù)海洋中的一滴水,如果將這滴水放入大海,挖掘出的數(shù)據(jù)價(jià)值將會(huì)成倍增長。例如火力發(fā)電廠與其設(shè)備制造廠都有針對(duì)設(shè)備和零部件的大量數(shù)據(jù),但電廠保存的是設(shè)備的缺陷信息、生命期參數(shù)信息等數(shù)據(jù),而設(shè)備制造廠保存的是設(shè)備部件材質(zhì)、質(zhì)檢情況、流水線信息等數(shù)據(jù)。以往這些數(shù)據(jù)是割裂的,是信息孤島,很少能一起用來進(jìn)行數(shù)據(jù)挖掘。但“大數(shù)據(jù)”時(shí)代可以對(duì)這些數(shù)據(jù)價(jià)值進(jìn)行深度挖掘,電廠的設(shè)備缺陷信息、生命期參數(shù)信息等數(shù)據(jù)可以反饋回設(shè)備制造廠家,用于設(shè)備改進(jìn)以及更精準(zhǔn)地進(jìn)行市場(chǎng)定位。設(shè)備制造廠家的設(shè)備部件材質(zhì)、質(zhì)檢情況、流水線信息等數(shù)據(jù)傳遞給電廠用來指導(dǎo)檢修和設(shè)備狀態(tài)調(diào)優(yōu)。通過信息匯總后的數(shù)據(jù)挖掘,可以得到對(duì)雙方都有用的數(shù)據(jù)價(jià)值,并且這些數(shù)據(jù)價(jià)值是不可能單獨(dú)從一方的數(shù)據(jù)中挖掘得到的。
“大數(shù)據(jù)”時(shí)代,火力發(fā)電廠的數(shù)據(jù)會(huì)持續(xù)增長。面對(duì)海量數(shù)據(jù),數(shù)據(jù)價(jià)值深度挖掘尤為重要,挖掘更多的數(shù)據(jù)價(jià)值意味著可以為企業(yè)節(jié)省更多的成本和創(chuàng)造更高的利潤,否則就如同坐擁金山而不自知。努力提高信息化水平,培養(yǎng)專業(yè)人才,深度挖掘數(shù)據(jù)價(jià)值,必然是火力發(fā)電廠管理模式發(fā)展的趨勢(shì)。
國電中星是電力測(cè)試設(shè)備生產(chǎn)廠家,密切關(guān)注電力相關(guān)行業(yè)的動(dòng)態(tài)與發(fā)展,更多資訊盡在國電中星官網(wǎng)www.dubmansion.com。