文 / 華夏銀行信息科技部副總經理 易永豐
基于工具分散且主要依靠運維人員經驗進行故障定位的狀況,華夏銀行提出了構建“以業務為中心,以流程為導向、以運維大數據為抓手”的一體化智能運維管理體系。目前已初步建成了一套集運維可視化、自動化、移動化、智能化等功能特點為一身的智能化運維平臺。
可視化平臺
1.配置管理系統。豐富CMDB配置項,以其為基礎,設計開發了架構可視化管理的配置工具,通過簡單拖拽式界面配置,即可明確描繪出業務系統自上至下的組件關聯關系,交易由外到內的交互關系。
2.iDo運維開發平臺。以iDo運維開發平臺作為統一的集成中心,實現了可視化全景關系展示墻,用于解決最常見的運維問題場景。一是建立“統一事件中心”,將總分行系統、網絡、交易、審計、安全風險等各類告警事件進行了完整集成。二是設計開發了“重要系統全景關系”視圖,實現了簡單的應用畫像功能,將系統內部架構、交易上下游關系、運行指標快照、告警提示等統一展現。三是“運維服務水平”視圖,統計指標包括自動化交付率、故障自愈率、事件平均響應時間等指標。
自動化流水線
目前我行已將自動化與智能化技術運用到運維管理中,增強對業務快速變化的適應能力。
1.自動化作業調度。改變了原有人工提交作業的操作方式,通過穩定、可靠的批量排期工具,對執行的作業進行自動調度和控制,實現生產值班0操作。
2.建立自動化運維模型。通過對各類運維操作進行標準化定義,建立統一的自動化運維模型,將各類系統標準化為應用、環境、服務/組件、服務器、屬性五大類,維護人員根據需要靈活組合發布場景,以“自服務”方式完成方案定制。
3.復雜運維場景一鍵式處理。為了進一步提升版本投產、年度演練、應急切換等多系統復雜場景下的操作效率,我行還建成了一套流水線式投產及切換平臺。該平臺依托于自動化系統、流程管理系統等各類運維工具系統,主要包括投產及切換指揮、方案編制、執行調度等邏輯模塊。
4.應急工具箱。應急工具箱集成了各類啟停操作任務、異常檢測任務、日志查詢任務等,便于維護人員快速及時地進行問題處置及定位分析。
運維移動化
為進一步提高運維工作效率,深化“無人值守”的智能化運維建設目標,我行還將上述各類工具及功能進一步擴展到手機平臺上,設計開發了“i掌運”系統。目前該系統已集成了監控、自動巡檢、自動化發布、流程審批、應急工具箱、資產自動盤點等11個大類,200多子項功能,成為支撐我行智能化運維發展的重要工具。
運維智能化
我行在旁路鏡像監控、日志監控、業務組件監控的基礎上,沉淀運維數據,構建了一套故障診斷的關聯分析算法。從2013年開始探索對故障的早期預警,嘗試了時序分析、神經元網絡、網絡貝葉斯等算法,相比傳統固定閥值的監控方式更為準確、靈活,更及早發現系統未知異常。
1.智能化監控及故障診斷。采用基于業務、IT層級和全路徑三個維度的監控覆蓋手段,結合數據處理引擎和智能的關聯分析算法,對海量監控數據進行實時處理,實現較為準確快速的故障定位。目前,已基本實現近70%左右日常事件的自動識別能力。
2.運維數據分析及預測。運維管理工作逐步向業務運營和用戶服務等領域延伸,利用運維大數據實時數據處理能力,結合業務場景,對業務運營數據深入挖掘分析,協助業務部門優化服務效率,提升運維服務價值。
責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。