文 / 中國銀行數據中心副總經理 袁俊德
目前,智能化運維體系建設,已經成為中國銀行“科技引領”戰略中的一項重要基礎性工程。為此,我們在數據中心層面專門成立了智能化運維工作組,由總經理擔任組長,強化頂層設計和前瞻規劃,在結合自身實際需要與業界發展趨勢的基礎上,提出了“把握一個原則、實現兩個融合、提升五大能力”的智能化運維體系規劃和建設總體思路。即:要把握安全合規與敏捷高效相平衡的原則;一方面,要實現新技術與傳統運維技術相融合,另一方面,要實現技術手段進步與管理流程優化相融合;重點提升“運行狀態的趨勢預測”“生產事件的精準定位”“服務的快速交付”“運維操作的自動化執行”“資源的靈活擴展及有效利用”五方面的能力。
智能化運維技術框架規劃
經過多年的持續建設,中國銀行數據中心已經形成了較為成熟的“以事件為驅動”的運維管理體系。在當前和未來的一段時間,該體系仍將會在確保數據中心的安全生產方面發揮重要作用。同時,基于該體系的細致化分工方式,也使得數據中心的運維工具形成了垂直化的管理格局,增加了后期管理和功能擴展的難度。
在制訂中心的智能化運維技術框架時,我們把實現“平臺化、集成化和數據驅動”作為了最主要的設計目標。我們要將原來分散設計、分期實現的各類工具,依照所使用的運維領域進行框架整合,結合新技術的使用,逐步建成包含基礎設施層、數據算法服務層、自動化運控服務層、交互管理服務層、監測服務層、開發與質量控制服務層在內的若干運營平臺。同時,使各層平臺之間,能夠相互調用,實現數據的交換和共享,將數據激活并轉化為知識和洞察力。
數據中心智能化運維實踐
1.云中心智能化運維平臺研發實踐。作為配合數字化轉型戰略的重要舉措,2018年以來,中國銀行加快推進分布式私有云中心建設,同步開展了智能化運維平臺—“云圖”的研發工作?!霸茍D”基于開源軟件進行分層設計、模塊化部署,提供CMDB、智能監控、自動化工作流管理、運維大數據分析、DevOps等多項功能。
平臺上線以來,已管理所有部署于云中心的機房設備、網絡設備和IaaS平臺,使系統自動化部署的效率提升了幾十倍,基本實現了系統環境的一鍵式交付。目前,“云圖”已累計納管了數個Openstack集群、千余個系統分區,部署了近十萬個監控點。隨著云中心建設的持續深入,預計至2019年底,“云圖”納管的系統分區將達到上萬個。
2.傳統集中式架構的自動化和智能化實踐。在傳統集中式架構的運維管理方面,數據中心以提升運維效率、降低人為操作風險為目標,選擇了應用部署、例行變更等工作量占比較高的類別,重點開展自動化和自服務化改造。目前,已實現主機、小型機和x86等多個平臺的應用自動化部署,發布效率得到了3~5倍的提升。
另外,數據中心綜合運用“大數據、機器學習和可視化”等技術,實現了對應用交易的端到端監控,對應用訪問量和系統重要性能指標的關聯分析與預測,以及對機房環境、CMDB信息的3D仿真展現。在“快速發現問題、定位問題”方面,取得了一些有益的成果。
3.網絡安全領域的智能化研究探索。信息安全管理既是運營管理的關鍵領域,也是運用數據挖掘、機器學習、人工智能等新技術的重要場景方向。2018年,中國銀行已啟動了企業級SOC建設工作,并側重在自適應網絡安全架構中的預測和檢測兩個維度,開展相關的智能化研究探索。
通過與國家信息技術安全研究中心聯合開展課題攻關,設計開發了網絡安全情報系統,致力于形成金融行業共享的情報獲取生態機制。在單要素威脅場景的精確檢測領域,選擇了WebShell后門和DGA域名兩個場景,結合自然語言處理等技術,對深度學習算法在該領域的適用能力進行了研究,取得了優于同類工具的檢測效果。
責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。