大數據在能源領域的應用?楊 斌1,楊濟海2(1.國家電網公司,北京100031;2.國網江西省電力公司信息通信分公司,江西 南昌330077),我來為大家講解一下關于大數據在能源領域的應用?跟着小編一起來看一看吧!
大數據在能源領域的應用
楊 斌1,楊濟海2
(1.國家電網公司,北京100031;2.國網江西省電力公司信息通信分公司,江西 南昌330077)
摘 要: 電力通信網是電力系統的專用支撐網,電力通信網本身的智能化、自動化和管理水平決定了其對電網業務的支撐能力,是智能電網、能源互聯網能否真正實現并産生社會和經濟效益的關鍵。通過對電網通信的現狀進行分析,論證了開展大數據研究的可行性和必要性,提出了資源實體、支撐能力、管理提升、系統提升、數據可視化五個應用方向。舉例說明了如何針對電網通信的需求進行“按需選法”将大數據成果與實踐相結合,分析了電網通信在應用大數據後,如何實現通信網的支撐能力提升和電網業務可靠性提升,如何通過數據價值為電網企業創造效益。
0 引言
在“互聯網 ”時代,以大數據為代表的新一代信息通信技術已經深度融合于各個專業領域中。智能電網、能源互聯網的核心特征就是網架堅強、廣泛互聯、高度智能和開放互動,電網技術和信息通信技術的全面融合,是推動電網向能源互聯網發展的根本動力。電力系統的專用支撐網——電力通信網本身的智能化、自動化和管理水平決定了其對電網業務的支撐能力,是智能電網、能源互聯網能否真正實現并産生社會和經濟效益的關鍵。目前國内外針對能源互聯網和電力系統的大數據研究已經全面開展起來,但是對于電網通信的大數據卻尚未有公開的研究成果。随着電力通信網信息化程度的不斷加深,通信管理、設備運行、網絡建設等方面的海量數據已經逐步積累下來,其中蘊藏了巨大的價值亟待發掘,将大數據應用于電網通信迫在眉睫。
1 現狀
大數據具有體量大、結構多樣、時效強等特征,其數據量巨大到無法通過人工在合理時間内處理并提取出适合人解讀的信息。大數據的實現必須采用新型計算架構和智能算法,在應用層面則強調以新的理念驅動輔助決策和發現新的知識。
國内外的大型企業都已經在全面開展大數據研究,向數據要效率,向數據要效益。要滿足電力數據飛速增長,滿足電力工業發展的需要,必須要依靠高性能計算、數據挖掘、統計分析、數據可視化等多種學科知識,電力系統必須提前、主動、全面開展數據分析和挖掘。
随着國家電網公司“三集五大”體系的深入發展,堅強智能電網建設迅猛,企業信息化工作全面推進。作為智能電網重要支撐的電力專用通信網絡通過三年的跑步前進邁入了信息化管理階段,建成了一套總部和省公司“兩級部署“,總部、分部、省公司、市縣公司“四級應用”的通信管理系統“SG-TMS”。通過标準化規範化的項目建設以及對系統實用化的大力推進,“SG-TMS”已經深度融入數萬電力通信專業人員的日常工作中,并且全面采集了數萬台設備幾年來的建設、運行、管理數據,積累下來的海量電力通信數據和衆多外部系統數據、公共數據一同形成了開展大數據分析的基礎。
2 應用方向分析
開展電力通信網大數據應用,不能僅僅隻關注通信網本身,而應着眼于通信網如何支撐智能電網乃至能源互聯網的實現。能源互聯網是以電力系統為核心,以信息通信技術和新能源發電等技術為基礎的複雜多網流系統,其中通信技術起到了支撐能源互聯網實現跨系統、跨平台數據交互的作用,是能源互聯網實現分布式、開放性等關鍵特征的基礎,電網通信的大數據必須把提升對電力系統的支撐能力、滿足電力系統發展的新需求作為核心出發點開展工作。開展電力通信網大數據應用,也不能僅僅隻是針對數據本身進行計算分析統計,而是要以問題為導向,通過挖掘潛在規律,全面指導設備運行、業務支撐、專業管理、系統提升等多個方面工作;通過數據可視化,将決策者、管理者乃至最基層的工作人員需要了解的有價值信息呈現在他們面前。同時要避免僅依托某個系統或者某個單一數據源的數據,必須要考慮多方外部數據的引入,隻有将多源的數據進行碰撞,才可以進一步開拓新的分析維度、放大數據的價值和能量,最大限度提升企業效益。具體在數據分析時可以考慮從以下五個方向着手:
(1)資源實體分析
綜合分析各類設備、設施的狀态和各類影響因子的關聯關系,發掘其中的隐藏規律。例如分析設備故障的發生和品牌、型号、地域、氣候、機房環境、運維人員素質、維護頻度之間的關系,可以指導采購、運維人員配置和運維措施的制定。甚至可以根據外部條件的變化情況預測設備故障發生的趨勢,在故障出現之前提前開展檢修消弭隐患。
(2)支撐能力分析
全量分析各類電網業務特征、業務狀态,可以分析出網絡瓶頸指導電力通信網的擴容改造關鍵點,基于現有數據實時分析業務發展趨勢并進行業務需求預測可以将指導規劃建設,縮短項目籌備周期,可以使企業投資更加精準高效,提升投資産生的效益。
根據業務特征計算業務可靠性,根據曆史發生的所有缺陷、故障影響的業務情況總結提煉出業務方式的最佳安排規則,例如宏觀上可以獲取繼電保護業務經過站點數小于多少個的情況下最為可靠,業務安全性是否有和下級通信網承載上級業務有關聯;細節上可以根據經過設備、纜路的多少及其運行狀态,是否配置了迂回路由等條件在方式開通時就計算出每條業務的可靠性,并且實時監控業務可靠性的變化狀态,在檢修、故障、方式調整等情況下導緻網絡環境發生變化時,及時預警業務可靠性下降的風險。
(3)管理提升
智能電網通信的信息化管理系統中已經積累了大量檢修數據、方式數據、運行記錄數據,其中既有規範的結構化數據如檢修類型、執行日期等,也有很多類似運行記錄一類的半結構化數據,還有很多類似路由方式描述、“三措一案”文檔、圖片等非結構化數據。通過對這些過程和結論數據的深入分析與挖掘,可以總結出管理規律,對現有的制度和管理方式進行優化和合理安排。還可以通過大數據手段實現對運行方式、“三措一案”等流程化工作的機器自動初審、對工作記錄的自動輔助糾錯補缺等智能化功能,降低管理人員勞動強度,提升方式、檢修審批效率和記錄規範性。
(4)系統提升
在功能實現和優化方面,通過部署用戶行為分析功能分析用戶行為,記錄和分析不同身份用戶的操作軌迹和功能使用集中度,實現對不同角色用戶的操作界面優化定制,将每個用戶最關心和使用頻率最高的功能放置在最容易觀察和操作的位置,并且指導系統的操作編排策略,調整菜單位置和界面,提升友好性。
在數據質量方面針對目前的海量存量數據,通過機器學習,自動聯想的功能提升數據質量,不僅僅是糾正數據格式層面的簡單錯誤,而是從邏輯分析的角度進行糾錯,将需要投入大量人力時間都無法完全完成的工作,交由機器完成。
目前電網通信的信息化管理系統,主要通過北向接口數據采集、用戶人工錄入、資源業務關聯等手段錄入數據,需要投入大量的人工勞動。通過大數據的方式總結關聯和錄入規律,實現輔助錄入、自動錄入和錄入糾錯功能,能夠提高人工效率并極大地提高整個電網通信信息化數據質量。
(5)數據可視化
通過數據可視化采用基于層次、基于圖形、基于幾何投影等不同展現方式,将原始數據中不容易被察覺的數據聯系呈現在不同角色面前。可以讓決策者獲得宏觀上有價值的趨勢性數據,也可以讓監視管理人員發現資源實體或者業務支撐層面發生的微小變化。
也可以通過設置監控大廳,對大數據提煉出來的信息進行7×24小時監測,全面跟蹤電網業務及通信的運行狀态和發展趨勢,及時響應出現的異動,通過電力通信網成熟的分級調度體系,迅速調集優勢力量消除隐患、改善運行狀态,将風險防範于未然。
3 技術選擇及場景分析
開展電網通信的大數據工作不但要完成描述性任務展示當前狀态,也要充分考慮預測性任務指導遠期工作,這就需要綜合運用多種技術和算法。在技術選擇時應遵循“按需選法”的原則,即從實際需求出發,先确定要展示和呈現的内容,預設要達到的效果,再選擇合适的提煉方式和算法,隻有這樣才能确保數據挖掘的成果與實踐相結合,并為電網所用。下面介紹一些可以應用于智能電網通信管理數據挖掘的技術及可能應用的場景。
(1)數據特征化
使用數據特征化(Data characterization)技術,可以實現對目标類數據的一般特性的彙總,并輸出多維表或者廣義關系規則。
例如通過對通信光纜占用率、設備帶寬占用率和槽位占用率等不同的數據特征來組織數據并進行維度挖掘,通過将資源按占用高低進行分析和展示,再采用OLAP的方法進行上卷或者下鑽,最終可以發現占用率高的光纜和設備有所屬站點電壓等級高、電網出線方向多、光纜跨距長等特征,此結論可應用于指導後期的光纜建設中,針對有上述特征的光纜加大建設容量。在應用大數據的方法之前,因為無法通過人力對百萬公裡級數的光纜進行深度分析并且提煉規律,在配置光纜容量的過程中更多的是依靠典型配置、估算等方法。
(2)挖掘頻繁模式
頻繁模式(Frequent pattern)是數據中頻繁出現的模式,主要用于挖掘數據中的關聯和相關性。
在需要尋找設備故障、檢修頻率、承載業務、運行狀态、網絡結構等多影響因子之間的關聯關系時,可以通過Apriori算法發現頻繁項集、設置多維關聯規則尋找數據規律。通過貝葉斯定理提供的預測算法,預測網絡中每一台設備、纜路可能發生故障的概率,或者分析網絡上每一個操作或者每一個對象的故障會造成的影響,進而分析整個通信網絡的可靠性和對電網業務的支撐能力。
(3)離群點分析
離群點(Outlier)是指數據集中可能包含一些數據對象,它們與數據的一般行為或模型不一緻,這些數據就是離群點。在驗證數據有效性并開展AI輔助糾錯時需要進行離群點分析。
例如對光纜芯數組成進行離群點分析,可以發現在除了常用的12、24、36、48等芯數的光纜之外,還會存在有極少數的11、13、25等芯數的光纜,這些組成方式在現實中是不可能存在的,可以判斷為錯誤數據,在統計計算中需要剔除其影響,并且可以進一步從錯誤數據的其他維度進行OLAP下鑽并進行特征對比和關聯性分析,選擇可能性最大的原因嘗試進行修正。比如把11、13修正成12,25修正成24等,當然這種修正并不是簡單的數據分檔歸一化,而要在海量數據的基礎上應用分類、預測和回歸等技術,涉及到許多複雜的算法。
(4)聚類分析
聚類分析(Clustering)是根據最大的相似程度、最小的類間相似程度的原則進行聚類或者分組。我們在進行業務分析預測時,可以将起點、終點、路徑、速率各不相同的海量調度生産業務、經營管理業務進行聚類分析,最終從業務類型、等級等方面等得出各類業務在帶寬占用、路徑占用等方面的特征,從而獲取業務量、增長量并預測帶寬需求發展趨勢。這些信息可以從宏觀上指導智能電網專用通信網絡的建設和改造方向。
通過将涉及電網繼電保護、安全穩定控制、調度數據網等重要生産業務的曆史故障和缺陷情況進行概率層次聚類分析,發掘出風險關聯性,找到共性規律和通用薄弱環節,制定相應的對策和防範措施提升電網業務的可靠性,預測并在故障和缺陷發生之前進行加固和防護,大幅度提高電網業務的安全運行水平。
4 結語
通過将大數據應用于電網通信,可以構建數據價值支撐電網通信的管理框架,組建開放式的電網通信數據價值管理體系,實現對電網業務和通信網絡發展趨勢的分析預測,自動預判瓶頸和故障,機器學習,AI輔助工作等智能化功能。可以結合不同類型電網業務的發展和運行情況,總結提煉出隐藏規律,更有針對性地指導項目建設、改造、大修和設備選型的開展,在方式安排、方案設計上的切入點将更加精準,并大幅度提高電網的投資利用率。
大數據帶來的更加豐富的管理手段,将促進電網通信運行水平和管理效率的提高,為能源互聯網的實現打下堅實的新型體系支撐、實體網絡支撐和通信技術支撐基礎,在進一步提升電網安全預控水平和供電可靠性的同時,帶來巨大的社會效益。
參考文獻
[1] Han Jiawei,Micheline Kamber,Jian Pei.數據挖掘與技術[M].北京:機械工業出版社,2012.
[2] 王繼業,郭經紅,曹軍威,等.能源互聯網信息通信關鍵技術綜述[J].智能電網,2015(06).
[3] 陳星莺,張曉花,瞿峰,等.數據挖掘在電力系統中的應用綜述[J].電力科學與技術學報,2007(03).
[4] 程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014(09).
[5] 米允龍,米春橋,劉文奇.海量數據挖掘過程相關技術研究進展[J].計算機科學與探索,2015(06).
[6] 張東霞,苗新,劉麗平,等.智能電網大數據技術發展研究[J].中國電機工程學報,2015(01).
[7] 董朝陽,趙俊華,文福拴,等.從智能電網到能源互聯網:基本概念與研究框架[J].電力系統自動化,2014(15).
[8] 孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013(01).
[9] 曹孝元,胡威,陳亮,等.建設大數據時代的透明電力通信網[J].電力信息化,2012(10).
,