下载此文档

机房运维方案.docx


文档分类:通信/电子 | 页数:约67页 举报非法文档有奖
1/67
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/67 下载此文档
文档列表 文档介绍
机房运行维护
作建议书
为加强 ******** 单位数据中心机房各系统的运行维护和管理工作, 保证
系统长期稳定、高效运行。根据 ************** 信息化工作管理规定,编制
适合于 ****** 机房运维方案。
运维现状分析
****** 数据中心机房目前由 ******* 部门管理,由指定的外协公司承
接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运行物
理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各
个供应商按项目签订的协议提供免费服务, 目前这些免费服务大部分处于
过期或者即将到期的状态。
目前机房运维没有涵盖桌面终端、 大楼综合布线、 楼层配线间与设备
间等,未构成一个完整的运维体系。
故障连带现象
多方运维导致机房出现中断或者服务不良的情况时有发生。 ********
公司机房由于始终未能受到规范统一的运维管理, 加上机房作为数据核心,
由各种外部单位组成的运维团队无论在数据安全性、 人员责任感、 技术全
面性等方面,都难以保持机房的持续性运转。
我们没有精确的数据来说明机房的运行情况, 这也是目前运维工作尚
未达标的一种表现, 同样, 这也导致我们对现状无法进行精确描述。 但是,
通过一些现象仍然可以发现机房运维工作应该大幅度改进。
长时间断网
具体原因不详, 但由于机房服务器大部分无法接通, 成都地区的二级
单位网络依赖的 DHCP 服务无法使用等现象持续多个小时, 发现晚, 响应 慢。
上班时间网速慢
具体原因不详,但简单归结为SEP或者人多并不能完全的解释网速慢
的问题, 由于网络是信息化建设的基础, 充分发挥机房内部与外部的资源
是运维工作的重要职责。
服务意外退出
当虚拟机系统开始引入后, 我们时常发现挂载在虚拟机系统上的一些
服务器无故宕机且不知道任何原因, 当用户需要使用时, 由于无法自动恢
复,影响正常工作。
不易寻找责任人
机房是一完整的整体, 涉及到环境、 网络、 服务器、 存储、 操作系统、
数据库、应用软件等,当一个故障发生时,难以判定故障原因,而目前机
房是各个外协单位各施其责, 最终造成故障排除时间缓慢, 相互推诿的情
况时有发生。
半自动化运维现状
目前许多企业的 IT 运维已经实现从人工运维到计算机管理,但延展
咨询在同客户的交流中发现其中很多企业的 IT 运维管 理还只是处在 “半
自动化 ”的运维状态。因为这种 IT 运维仍然是等到 IT 故障出现后再由运
维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的 IT 运
维管理模式经常让 IT 部门疲惫不堪,主要表现在以下三个方面 :
运维人员被动、效率低
在 IT 运维过程中,只有当事件已经发生并已造成业务影响时才能发
现和着手处理,这种被动 “救火 ”不但使 IT 运维人员 终日忙碌,也使 IT
运维本身质量很难提高, 导致 IT 部门和业务部门对 IT 运维的服务满意度
都不高。 目前绝大多数的企业 IT 运维人员日常大部分时间和精力是 处理
一些简单重复的问题, 而且由于故障预警机制不完善, 往往是故障发生后
或报警后才会进行处理, , 使到 IT 运维人员的工作经常是处于被动 “救火 ” 的状态, 不但事倍功半而且常常会出现恶性连锁反应。
缺乏一套高效的 IT 运维机制
目前许多企业在 IT 运维管理过程中缺少自动化的运维管理模式,也
没有明确的角色定义和责任划分,使到问题出现后很难 快速、准确地找
到根本原因, 无法及时地找到相应的人员进行修复和处理, 或者是在问题
找到后缺乏流程化的故障处理机制, 而在处理问题时不但欠缺规范化的解
决 方案,也缺乏全面的跟踪记录。
随着信息化建设的深入,企业 IT 系统日趋复杂,林林总总的网络设
备、服务器、中间件、业务系统等让 IT 运维人员难以 从容应对,即使加
班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,
严重影响企业的正常运转。 出现这些问题部分原因是企业缺乏事件监控和
诊断工具等 IT 运维技术工具,因为在没有高效的技术工具的支持下故障
事件很难得到主动、快速处理。
现在随着 IT 运维管理工作的复杂度和难度的大大增加,仅靠过去几
个 “运维英雄 ”或 “技术大拿 ”来包打天下已经行不通 了,企业开始需要运
用专业化、 标准化和流程化的手段来实现运维工作的自动化管理。 因为通
过自动化监控系统能及时发现故障隐患,主动的告诉用户需要关注的资
源,以达到防患于未然。例如,全天候自动检测与及时报警能实现 IT 运
维的 “全天候无人值守 ” ,大大降低

机房运维方案 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数67
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2072510724
  • 文件大小129 KB
  • 时间2021-07-17
最近更新