云平台下的运维体系建设工作内容
系统运维
系统运维负责IDC、网络、CDN和根底效劳的建设〔LVS、NTP、DNS〕;负责资产管理,效劳器选型、交付和维修。详细的工作职责如下:
IDC数据中心建设
收集业务需求,预估未。
应用运维
应用运维负责线上效劳的变更、效劳状态监控、效劳容灾和数据备份等工作,对效劳进行例行排查、故障应急处理等工作。详细的工作职责如下所述。
设计评审
在产品研发阶段,参与产品设计评审,从运维的角度提出评审意见,使效劳满足运维准入的高可用要求。
效劳管理
负责制定线上业务升级变更及回滚方案,并进行变更实施。掌握所负责的效劳及效劳间关联关系、效劳依赖的各种资源。能够发现效劳上的缺陷,及时通报并推进解决。制定效劳稳定性指标及准入标准,同时不断完善和优化程序和系统的功能、效率,提高运行质量。完善监控内容,提高报警准确度。在线上效劳出现故障时,第一时间响应,对线上故障能按流程进行通报并按预案执行,未知故障组织相关人员联合排障。
资源管理
对各效劳的效劳器资产进行管理,梳理效劳器资源状况、数据中心分布情况、网络专线及带宽情况,能够合理使用效劳器资源,根据不同效劳的需求,分配不同配置的效劳器,确保效劳器资源的充
分利用。
例行检查
制定效劳例行排查点,并不断完善。根据制定的效劳排查点,对效劳进行定期检查。对排查过程中发现的问题,及时进行追查,排除可能存在的隐患。
预案管理
确定效劳所需的各项监控、系统指标的阈值或临界点,以及出现该情况后的处理预案。建立和更新效劳预案文档,并根据日常故障情况不断补充完善,提高预案完备性。能够制定和评审各类预案,周期性进行预案演练,确保预案的可执行性。
数据备份
制定数据备份策略,按标准进行数据备份工作。保证数据备份的可用性和完整性,定期开展数据恢复性测试。
数据库运维
数据库运维负责数据存储方案设计、数据库表设计、索引设计和SQL优化,对数据库进行变更、监控、备份、高可用设计等工作。详细的工作职责如下所述。
设计评审
在产品研发初始阶段,参与设计方案评审,从DBA的角度提出数据存储方案、库表设计方案、SQL开发标准、索引设计方案等,使效劳满足数据库使用的高可用、高性能要求。
容量规划
掌握所负责效劳的数据库的容量上限,清楚地了解当前瓶颈点,当效劳还未到达容量上限时,及时进行优化、分拆或者扩容。
数据备份与灾备
制定数据备份与灾备策略,定期完成数据恢复性测试,保证数据备份的可用性和完整性。
数据库监控
完善数据库存活和性能监控,及时了解数据库运行状态及故障。
数据库平安
建设数据库账号体系,严格控制账号权限与开放范围,降低误操作和数据泄露的风险;加强离线备份数据的管理,降低数据泄露的风险。
数据库高可用和性能优化
对数据库单点风险和故障设计相应的切换方案,降低故障对数据
库效劳的影响;不断对数据库整体性能进行优化,包括新存储方案引进、硬件优化、文件系统优化、数据库优化、SQL优化等,在保障本钱不增加或者少量增加的情况下,数据库可以支撑更多的业务请求。
自动化系统建设
设计开发数据库自动化运维系统,包括数据库部署、自动扩容、分库分表、权限管理、备份恢复、SQL审核和上线、故障切换等功能。
运维研发
运维研发负责通用的运维平台设
最新云平台下的运维体系建设工作内容 来自淘豆网m.daumloan.com转载请标明出处.