(完整word版)日常运维管理制度.doc日常运维管理制度
1. 运维保障机制
建立硬件、网络、系统、应用及业务软件日常维护流程机制;
建立故障应急处理流程机制;
建立备份恢复保障机制;
建立安全保障管理机制;
建立版本管理机制,管理平台生产环境运行的软件版本; 以上机制应形成文档,作为日常遵循规范,按要求执行。
2.硬件维护能力
需对硬件设备具备 7*24 小时不间断的支持、响应能力,原则上每 日对硬件设备至少健康检查一次并记录;定期对网络环境进行检查。 我公司服务器部署在移动云上定期通过命令进行硬件检测, 内存、硬 盘、 I/O 的使用情进行查询并进行登记,每台服务器运行的软件对硬 件性能使用情况检测,对于服务器我们进行系统备份、软件,每日对 网络使用情况进行观察,针对突发异常流量进行分析。
故障处理响应及要求
设备(系统)出现故障时,根据不同的故障级别提供相应的
服务响应,响应方式及要求如下:
故障级
别
故障内容
响应时间及效
果
其他
I 一般
故障
出现系统故障,不影响系 统运行,不影响业务正常运 作
工程师即时响应 处理,24小时内解 决。
对于硬件 故障(含机房 环境故障), 要求不论在 何时确诊需 要进行备件 更换,发出备 件更换指令 起3小时内备 件到达故障 现场,并恢复 系统正常运 行。
II 次
要故障
出现系统故障,影响系统
运行或影响非关键业务运
作,不影响核心业务运作
工程师即时响应
处理,8小时内解
决。
III 重
大故障
出现系统故障,系统崩溃
或其他状况,影响核心业务
的正常运行
工程师即时响应
处理,2小时内解
决。
具备应急预案
针对部署台节点服务器我们实施系统备份、软件重要数据
实时备份,主机备份是提供的保留某个时间点上的主机系统数据状态 的服务。基于主机备份可以随时生成或删除备份, 并基于已备份进行 主机的恢复,实现已有应用和主机数据的快速复用, 如系统出现事故 无法使用将进行系统恢复并把最近一次备份的数据进行恢复。对于突 发情况建立应急服务流程,主要是针对可能发生的各种意外情况设计 应急的方案,以控制和规避突发事件带来的集中性风险, 从而降低设 备集中性风险所造成的损失,制定以下流程图:
应急机制处理流程图
为保证服务实施的质量能够稳定并不断有所提升, 保障客户需求能够 得到有效满足,保障服务实施团队为客户提供统一、标准化的服务支 持,并为客户设立专门的技术服务专员,对进行全程跟踪,提升服务 实施专业性,制定服务流程:
服务台及现场服务流程图
用户
服务台
技术支持
服务经理
需求
*录服务请求 *
理受务服
理处务服〉
束结务服〉
解决
结束
解决
解决
服务支持
数据库维护能力
每日对数据库进行日常巡检,内容包括对日志、会话数、表空间、
磁盘空间等主要数据库参数进行检查 (需要配置监控软件);对数据 库进行数据备份、归档日志整理、表空间维护、权限分配、异常问题 处理;对数据库相关JOB进行维护;定期对数据库进行重启,以释放 资源;制定数据备份方案及数据恢复演练方案, 定期进行数据恢复演 练。
6.中间件维护能力
对中间件进行运行状况
(完整word版)日常运维管理制度 来自淘豆网m.daumloan.com转载请标明出处.