前言
当我们在生产环境中完成 PowerHA7 的实施并交付使用,在接下来
前言
当我们在生产环境中完成 PowerHA7 的实施并交付使用,在接下来长期的运维阶段,需要定期的对 PowerHA 的健康状态进行检查,从而可以减少或预防 HA 发生异常保障其高可用功能和特性的正常启用。
那么对当前 PowerHA 环境要进行哪些方面的检查,是大家需要关注的。结合我们在日常的工作经验,接下来为大家介绍一下 PowerHA 的巡检检查项目都有哪些。
检查项目
配置与信息收集
AIX 及 HA 版本检查;
CAA 配置参数;
配置文件检查;
/etc/hosts 文件检查;
/etc/cluster/rhosts 配置文件检查;
光纤卡及共享存储盘参数检查;
磁盘链路状态检查;
共享卷组( VG )属性检查;
共享卷组内文件系统属性检查;
APP 启停脚本文件检查;
LPM 策略配置检查( PowerVM 环境);
Cluster 的配置同步状态检查;
HA&CAA 状态检查
clstrmgrES 核心进程状态;
HA&CAA 重要服务进程状态;
HA 组服务运行状态;
HA 全局运行状态检查;
资源组配置及状态检查;
资源状态检查;
gsclvmd 服务进程状态;
共享 VG 同步状态检查;
CAA 状态;
Errorlog 检查;
CAA 日志检查;
日志检查;
日志的检查;
对上述检查项列表中常见的检查项说明如下:
AIX 及 HA 版本检查;
检查项说明 :
检查 AIX 系统与 HA 的版本及补丁,并查询 IBM 发布相
应版本的 HIPPER BUG ,最终需要决定是否安装。
检查方法:
oslevel -s , 操作系统版本; halevel -s , HA 版本; instfix –i ;
CAA 配置参数
检查项说明:
收集当前 CAA 的配置参数用于检查心跳间隔、节点失败检测超时等;
配置文件检查
检查项说明:
检查每个节点上的 配置是否存在其内容是否正确: !REQD ,应包括一条或多条此格式的记录,其中 owner 为本地节点上正在使用的 IP 地址, target 为目标 IP 。
检查方法:
为文本文件,可直接 cat 读取;
hosts 配置文件检查
检查项说明:
检查每个节点上的 /etc/hosts 文件内容,最近有无改动、确认关键记录是否正确、内容在在多个节点上是否是一致的。
检查方法:
/etc/hosts 为文本文件,可直接 cat 读取;
共享卷组( VG )属性检查;
检查项说明:
检查共享卷组的自动激活属性是否关闭、卷组类型
PowerHA健康检查建议 来自淘豆网m.daumloan.com转载请标明出处.