NetGain Systems
天津移动
Gain Enterprise Manager 成功应用天津移动
建立容灾系统监控管理的目的是实现天津移动集团总公司提出的“维护集中化、
管理自动化”的要求,以形成一个有机的管理结构,合理利用人力资源、减少维护
的复杂程度,降低运营成本。在容灾系统中,应采用能从宏观和微观的各个角度进
行主动管理的手段,以容灾为主线将相互孤立的各服务器监测贯穿起来,随时监控
和统计整体运行状态和性能水平。
1. 容灾系统监控的整体架构
在天津移动容灾环境中采用分层次的方法对其进行监控,如下图所示:
在容灾环境中,按照分层次的方法对其进行监控管理,分别采用不同的工具,但是
我们将对不同的工具进行完善和客户化,来满足对灾备系统整体监控和管理的需求。
我们将采用 StorWatch Expert 和 SAN manager 对存储系统进行管理,同时与
采用 SAN Manager Gain iOSS 对存储系统架构和灾备主机的操作系统升级
和容灾应用环境进行监控,但更重要的是将这些工具集成在一起,为天津移动的灾
备系统提供统一的监控,整体的结构框架如下所示:
NetGain Systems
事件集成与过滤
数据监控、采集
系统环境
Processor
Memory
Cache
I/O
O/S
从整体环境考虑, StorWatch Expert 实现对 ESS 存储设备的监控管理,SAN
Manager 实现了对 SAN gain iOSS (Monitors 模块)
实现对灾备主机和包括 TSM 在内的容灾应用的监控。gain iOSS(Alarm
Manager 模块)作为统一的事件告警处理平台,负责接受和处理由 StorWatch
Expert、SAN Manager gain iOSS (Monitors 模块)发送的事件。一方
面该事件告警处理平台作为日常的管理人员监控界面,包括了容灾系统环境监控的
所有事件信息,另一方面该模块提供了 BOSS 网管系统接口,可以在将来将其所接
收和分析的事件转发至 BOSS 网管系统,将容灾系统的监控融入到 BOSS 网管的大
环境中。
2. 核心基础层和灾备业务层监控
为了实现对容灾系统中计算机网络及系统管理的目标,Gain Systems
Gain iOSS 管理套件实现对容灾环境中系统平台计算机网络及系统的管理。
NetGain Systems
NetGain iOSS 是基于分布式,模块化,多线程和分层次的软件结构。包含多
个紧密集成的组织模块,通过其对容灾环境的管理,可以支持容灾环境的业务正常
运营保障,并提供集中统一的、标准化数据管理,和统一的用户定制工具。
NetGain iOSS 监控平台结构图见下图所示:
拓扑视图故障浏览器性能报表服务水平汇总服务水平报告配置界面工作流程管理
表
示
层
统一监控管理视图
故障处理网络与系统性能和服务质量故障管理工作流管
和存储自动发现监控,报表生成理
应
Alarm Topology Perf/SLA Proc
建立容灾系统监控管理的目的是实现天津移动集团总公司... 来自淘豆网m.daumloan.com转载请标明出处.