统一存储双活方案
1、双活存储架构建设目标
系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括: ? 系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等;
? 机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等;
? 人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等;
? 自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:
当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。
其目标包括:
?
? 保护数据的完整性、一致性,使业务数据损失最少; 快速恢复业务系统运行,保持业务的连续性。
灾难恢复的目标一般采用RPO和RTO两个指标衡量。
技术指标RPO、RTO:
RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO
基本为异步传输数据
排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同步模式下,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性是不相同的,RPO表示业务数据与容灾备份数据的时间差。换句话说,发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。
RTO (Recovery Time Objective):即应用的恢复时间目标。RTO主要指的是所能容忍的应用停止服务的最长时间,也是是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。
各种用户的应用对RTO要求不同,业务繁忙的关键业务需要较小的
RTO,如果系统恢复时间过长就会影响到业务运行,而许多业务系统的RTO较长,如果一些较小灾难发生在非业务运行时间,那么对业务连续性几乎不会造成任何影响。各种容灾解决方案的RTO有较大差别,基于光通道技术存储区域网(SAN)的同步数据复制,配合远程备用业务系统和跨生产中心与容灾中心的高可用管理系统,这种容灾解决方案具有最小的RTO。相比较而言,普通磁带备份的RTO较长,当灾难发生时需要更长的时间恢复系统。
两存储之间为双活互备工作模式
结合业界现有的技术和实施经验,我们建议进一步完善和健全现有系统架构,全面提升应用系统可用性,满足业务系统需求:
? 采用存储级别的镜像技术实现,利用业界领先的技术,实现数据中心级别的高可用,可以有效防范
统一存储双活方案 来自淘豆网m.daumloan.com转载请标明出处.