淺談一體化智能監控運維

前言:IT監控運維繫統,起源於各設備廠家的網元網管等監控工具,伴隨著信息化的發展而升級換代,經歷了大數據、虛擬化、雲計算等技術革命的考驗逐漸完善成熟。IT監控運維繫統從最開始的解決故障,到提供高效的運維服務,已逐漸成為IT運維部門日常運維工作中必不可少的工具。

隨著企事業單位IT系統規模不斷擴大,構成IT基礎的設施呈現出規模龐大、結構複雜、品牌眾多的特點,為實現信息資源合理配置、有效管理,確保系統安全可靠運行,IT集中監控系統的建設成為企業信息化運維工作的重點之一。同時,運維活動也缺少管控,如沒有構建服務檯、知識庫、CMDB、事件管理等基本流程。此外,監控運維並不是簡單的“監控+流程”,兩者的有效結合也是一個難點。

傳統運維面臨的問題

錯綜複雜的IT元素難以有效監控

從宏觀上看,IT設施種類各異,組成複雜,從最基礎機房動力環境->基礎網絡->存儲->X86(小型機平臺)->系統->應用;從硬件到軟件;從後臺應用支撐服務到前臺頁面服務,這些錯綜複雜的IT元素很難有效整合監控。

從微觀上細究,特定IT設施種類各異,品牌繁多。以存儲為例,品牌涉及IBM、HP、EMC、Netapp 日立、華為、浪潮等,監控對象指標包含磁盤陣列的各個組件,指標包括風扇、電源、電池、控制器、硬盤的狀態、實時性能,以及交換機的各溫度、電池、主機映射關係等,獲取這些指標並非易事。

傳統運維工具單一,無法集中管控

企事業單位用戶可以通過廠家提供的管理工具,如vmware 的VC客戶端,存儲的管理客戶端,硬件服務器的web管理控制檯,或者通過查看日誌/硬件設備的指示燈等方式查看運行狀態和性能指標。顯然,這些零散的方式會增加運維工作量,影響故障發現的及時性,IT運維人員迫切需要一個統一集中的平臺將以上監控任務有效整合。同時,由於缺少有效的流程管控機制,運維工作總是處於“救火式”狀態。事前無準備,事中無跟蹤,事後無法追溯,運維經驗無法沉澱積累與複用。

運維過程無流程或流程不成體系

隨著信息化及互聯網+普及推廣,企事業單位已經從大規模的信息化建設向信息化運維轉變,運維團隊不斷擴大,信息化管理流程日益複雜,之前的紙製化審批流程效率低,難以適應新環境下的流程管理,需建立統一、規範、層次化的服務管理流程和服務管理體系。面對複雜的IT環境,缺乏規範化、自動化的運維處理流程,缺乏完善的故障處理和快速修復機制。

看OneCneter如何破局?

勤智運維磨礪多年,深刻理解IT運維“建設易,管理難”的特點和ITaaS背景下的服務轉型陣痛,結合多年運維實踐及對ITSS國家標準的制定與理解,推出OneCenter一體化智能運維管理平臺,將“監控、管理、治理”三方面有機融合。

OneCenter一體化智能運維管理平臺可以讓IT監控運維智能、高效、簡單、統一,幫助運維團隊實時、全面掌握IT運行態勢,及時響應和處理IT故障,為各企事業單位業務提供強有力的IT支撐和質量保障。

一體化IT設施監控體系

淺談一體化智能監控運維

勤智OneCenter的ITManager監控模塊,可對業務系統及支撐業務系統的所有IT資源進行7*24小時全面監控,提供性能監控與分析、資源可用性監控與分析、資源拓撲關係管理、故障監控、故障分析及定位,幫助IT運維人員提升工作效率。

開放式的一體化運維平臺

平臺將機房環境、IT基礎資源、應用系統情況進行統一展示、告警和管理,告別不同資源的離散管理模式。

多維度可視化視角

平臺通過網絡拓撲、業務系統、機房環境、虛擬化結構等多維度視角進行可視化展現,使資源全方位信息一目瞭然。

基於業務級運維

支撐企業運營的是各個核心業務系統,所以IT組織的視角逐步從資源級運維向業務級運維轉變,從業務角度出發,在可視化的業務視圖上業務架構、服務和所依賴組件一目瞭然。

更加聚焦故障管理

平臺通過極簡的界面和簡單的操作結合系統強大的後臺算法和分析能力,提供專業簡單的智能化故障處理引擎。

自學習的運維知識庫

幫助運維人員建立更加快速、高效地構建豐富的知識庫,利用知識庫快速對運維管理中發現的故障給出解決方案,恢復系統,確保業務正常運行。

淺談一體化智能監控運維

一體化運維平臺大數據分析能力

ITBA運維大數據分析系統是大數據技術在IT運維領域的應用。該系統運維內部整合了Hadoop、Spark、Kafka、MongoDB、Solr、Flume等多種大數據架構技術,提供多種類型數據接口的採集方式,實現多平臺/多業務的監控、流程等運維工具的數據整合和統一管理。同時,提供對於第三方業務平臺的數據展現、數據統計、告警分析和業務分析功能,可以將多個系統在門戶內進行統一登錄展現;也可以與其他系統對接,從第三方系統登錄至運維繫統平臺。一方面ITBA大數據作為統一運維監控的工具,可以採集各家數據,將非標準數據變為標準數據;另一方面可以提煉數據,進行檢索,做海量日誌分析。

淺談一體化智能監控運維

豐富的監控模型庫

全面靈活的監控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S 、JMX、GB/T28181、SDK、TCPDUMP等),使得系統具備全範圍的監控能力。OneCenter一體化智能運維管理平臺能夠監控各種操作系統、服務器硬件、網絡設備、各種WEB應用、數據庫、中間件、存儲、虛擬化、WEB站點等IT資源,還支持靈活的自定義腳本監控。

淺談一體化智能監控運維

告警集中展現

OneCenter 一體化智能運維管理平臺提供統一的告警管理,通過性能指標採集輪詢、調用廠家網管告警接口、網元Trap/Syslog主動推送、第三方系統輪詢獲取等多樣化的來源方式,獲得整個網絡系統中各種事件、設備故障、網絡異常等告警信息。當出現故障後,OneCenter一體化智能運維管理平臺能通過預置的報警方式,以郵件、短信、電話自動撥打等“告警必達”方式及時通知指定用戶,並能生成告警分析統計報告,提供主動式的故障解決方案。

淺談一體化智能監控運維

淺談一體化智能監控運維

統一的運維管理平臺,規範日常處理流程

OneCenter 一體化智能運維管理平臺 基於ITIL標準形成了一套結合服務檯、知識庫、CMDB、事件管理、問題管理等流程的統一運維管理平臺,可以和監控系統做無縫銜接,日常告警事件可直接觸發工單運維,提高工作效率。OneCenter系統採用多層架構及模塊化的設計,系統功能全面,模塊功能獨立,可根據不同需求自由組合。同時,OneCenter 一體化智能運維管理平臺具備良好的擴展性,通過第三方數據接口和數據總線以及門戶Portal,與第三方產品可進行無縫集成。

淺談一體化智能監控運維

另外,OneCenter 移動終端運維管理,提供移動服務檯、告警列表、工單待辦列表、工單查詢及處理操作、設備巡檢、系統公告接收和知識查詢等功能,為運維工程師提供了一種便捷的運維模式,有效提高IT部門整體運維能力。

淺談一體化智能監控運維

IT監控運維繫統已逐漸成為IT運維部門日常運維工作中必不可少的工具,並在很多已建成的運維項目中發揮著不可替代的作用。如國家核電統一運維項目,實現了統一監控、統一運維、統一展現等“七個統一”;湖北省公安廳智能IT統一管理平臺項目,實現全網上千種IT資源的統一管理和IT資源故障告警自動流轉進入服務流程;湘潭大學一體化運維項目,支持複雜環境的大規模監控,有效提升IT運維管理和服務能力。

相關推薦

推薦中...