某大型金融機構總部網管項目
項目背景
某大型金融機構是中國銀行卡聯合組織,處于銀行卡產業的核心和樞紐地位,是實現銀行卡系統互聯互通的關鍵所在。依托跨行交易清算系統,該機構制定和推廣銀聯跨行交易清算系統入網標準,統一銀行卡跨行技術標準和業務規范,形成銀行卡產業的資源共享和自律機制,從而對銀行卡產業的發展起到引導、協調、推動和促進作用。
各商業銀行通過該銀行卡跨行交易清算系統,實現系統間的互聯互通和資源共享,保證銀行卡跨行、跨地區和跨境的使用。
該機構的主要職責是負責建設和運營銀聯跨行交易清算系統這一基礎設施,推廣統一的銀行卡標準規范,為商業銀行、特約商戶、持卡人提供跨行信息交換、清算數據處理、風險防范等銀行卡基礎服務,推動銀行卡產業集約化、規?;l展,同時聯合商業銀行,創建銀行卡自主品牌。
客戶需求
為了該機構網絡進行全面系統的管理,需要制訂比較系統的管理流程,以使全網得到全面有效的管理。通過建立一套網管系統,可以很好地實現故障管理、性能管理和報表管理這三個管理功能。網管工具實現絕大部分工作的自動化處理,從而加強管理效果,提高網絡的安全生產率。
網絡設備數據采集需求
網絡管理系統是以事件管理為核心的實時網絡運行管理系統,要實現對網絡實時、不失真的監控,基礎數據的采集就尤為重要。
網絡及安全設備監控數據采集需求
1) 網絡設備環境特性監控:設備電源電壓、設備溫度(℃)等;
2) 設備性能監控:設備 CPU使用率、設備 memory使用率;
3) Dlsw狀態監控:監控 Dlsw peer變化、監控處于聯機狀態的 Dlsw circuits變化;
4) 鏈路層狀態信息監控:監控重要端口的狀態;
5) 設備冗余熱備狀態監控;
6) 路由信息監控:監控路由信息的變化情況;
7) 設備故障信息監控:運行中發生的設備硬件故障信息、軟件故障信息;
8) 防火墻的實時狀態和事件的監控(目前數據中心網絡中采用了 Cisco ASA、Juniper、Checkpoint等防火墻);
9) 網絡設備配置信息及變更的采集與監控;
10) 對備份線路使用狀況的監控;
11) 報警方式的多樣化,如手機短信息,窗口彈出消息,客戶端屏幕輸出等;
對網管服務器進行監控的需求
對網管服務器本身也要進行一些性能數據的采集,對網管服務器的操作系統、核心進程等進行實時監控,從而對網管服務器的運行狀況進行評價。
具體如下:
1) 對網管服務器的 CPU、內存等進行實時監控;
2) 對網管服務器的操作系統、核心進程等進行實時監控,并可定制對重要進程的自動處理(如進程自動重啟)等操作;
對其它網管設備的集成和兼容的需求
網管產品應具有比較好的兼容性,可以與已經部署的UMP、Netscout實現互操作。
故障管理、性能管理需求
故障管理
(1) 對網絡運營中比較常見的故障信息進行監控,如:網絡設備或系統重啟,局
域網 STP,網絡設備硬件,IOS的運作錯誤信息,廣域網 HSRP,局域網、廣
域網端口連接狀態,撥號(DDR、ISDN)狀態,EIGRP、OSPF 路由、BGP路由;
(2) 發生故障時,系統能在故障發生后小于60秒內收集到故障信息并告警;
(3) 具有分析故障信息的能力,根據故障的輕、重、緩、急來定義不同的告警級別,并且對故障信息進行關聯分析、壓縮處理,減少事件量;
(4) 對于未知的事件也應該詳細描述處理的方法;
(5) 能夠對原始的網絡事件信息進行豐富,增加報警信息的可讀性;
(6) 報警的方式應該具有多樣化,如聲音,手機短信息等;
(7) 可根據故障的種類、等級、時間、描述中的關鍵字等進行簡單查詢或復合查詢。
性能管理
(1) 對于一些性能數據,應該能夠周期性地主動采集性能信息,采集周期和采集時間可選擇;
(2) 能基于定義的閥值,發出警告;
(3) 并能根據網絡的實際運行狀況調整閥值。
網絡監控呈現及統計報表需求
網管系統的呈現界面應可以根據運維以及管理人員分工的具體要求,對不同角色的運維人員靈活設計不同的功能及監控界面。系統應能夠實現靈活定制并支持同時打開多個事件窗口,并提供靈活的過濾機制,同時不同權限的人員只能查看各自的監控圖和事件列表,實現分權管理。
網管系統的報表要求根據通過對網絡設備在采樣時間間隔進行采集和網絡設備主動發送的信息,對網絡性能管理和告警管理所獲得的信息進行匯總過濾,以數據庫的形式保存詳細的歷史紀錄,可以根據過濾條件靈活提供報表,并具有多種展示方式。對于性能數據,可以根據統計結果為網絡規劃提供依據。對于告警信息,網絡監控系統能夠按照日、周和月的時間關系生成“網絡設備故障統計表” 、 “網絡線路故障統計表” 、 “網絡線路可用率報表” 、 “機構網絡故障分級統計表”等表格,供網絡管理人員和領導定期分析網絡運行情況,掌握網絡的薄弱環節,為網絡升級改造提供科學依據。
解決方案
網絡管理系統采用 IBM 的 NETCOOL 網絡管理解決方案,提供各種管理功能的整合,整個管理方案圍繞網絡事件管理,將所有的管理報警信息,如網絡故障、性能下降、流量異常等都以事件的方式報告到網絡事件處理平臺,管理人員通過直觀的事件信息監控,可以了解網絡實時的運行狀況。
統一的網管系統提供從網絡事件管理、性能管理、資源管理和報表管理的全面管理功能。所有的管理功能采用 Web界面提供用戶的訪問,通過 NETCOOL/WebGUI 進行整合,并定制針對不同人員的不同管理信息和界面。
客戶價值
網絡管理功能與流程的結合
網絡管理系統,是由網絡管理技術,管理流程,管理人員的角色和管理職責共同構成的網絡管理解決方案。系統的設計充分考慮了與管理流程的結合,實現網絡運行監控和評估管理的需要,能夠適合用戶目前網絡環境和運維要求,并滿足未來網絡發展需要的高度靈活的可擴展性。
以事件管理為中心,支持問題管理流程
網絡管理系統的設計從滿足網絡管理的需求出發,通過 IBM Tivoli 以事件管理為中心的管理功能和流程,提高管理人員對網絡的實時監控能力,幫助網絡管理人員在網絡運行維護中主動快速發現和處理問題,同時結合性能、流量分析,對網絡進行統計分析和量化評估,為網絡的發展提供有效的管理數據。
對網絡具有全面的實時管理能力,并且可不斷完善和擴展
IBM Tivoli Netcool 網絡管理系統解決方案具有同時對網絡所有組成部分進行持續監控的能力,從而使管理人員能夠實時了解網絡的狀況,及時對出現的各種情況做出快速反應。同時隨著網絡的發展,技術的更新和廠家設備的豐富,IBM Tivoli Netcool 網管解決方案能夠通過開放的管理接口,不斷擴展,支持用戶網絡管理的要求。
IBM Tivoli Netcool 網絡管理軟件和解決方案將提供強大的功能,靈活的結構、接口,配合用戶在網絡管理解決方案上根據管理需要進行客戶化定制和開發,以滿足用戶建立深入的網絡管理系統的需要。
支持分層管理,權限分工,規范管理
解決方案支持集中分布式的管理和維護方式,為用戶建立分權的網絡管理系統,定義統一的管理策略和流程,規范網絡管理標準,并支持管理人員的不同分工權限的運維工作。
用戶逐步實現從網絡基礎架構到業務支持的全面管理
以網絡為基礎設施, 為業務提供基礎服務。 為了滿足用戶網絡管理和業務發展的需要,網絡管理解決方案能夠提供靈活的結構和功能,實現面向業務服務的網絡管理和功能,分析網絡故障對業務的影響程度,監控網絡為業務提供的服務質量,使網絡管理充分為業務服務,支持業務需要的網絡服務質量。
滿足現有需求和未來擴展的靈活應變
IBM Tivoli網絡管理軟件具有優異的可擴展性,能隨著用戶網絡和業務的變化,迅速調整并適應變化。
案例詳情