该【网上银行业务持续性计划与应急预案 】是由【麒麟才子】上传分享,文档一共【19】页,该文档可以免费在线阅读,需要了解更多关于【网上银行业务持续性计划与应急预案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:.
附件4
***银行
网上银行业务持续性方案及应急预案
一、目标及适用范围
为保障***银行股份〔以下简称“***银行〞或“本行〞〕网
上银行系统运行的平安性、稳定性,降低事故发生的可能性,减
少因事故发生而造成的损失,作为网上银行系统托管方的##科技
〔以下简称“##〞〕与***银行共同制定本持续性方案及应急预
案。
本方案及应急预案适用于网上银行托管平台所有系统运行
的软硬件设备、虚拟资源、相关管理制度、相关组织机构及人员。
二、组织架构
网上银行应急处理的组织架构,包括平安管理委员会、应急
处理小组、技术支持小组、事件宣告小组及相关公司。
〔一〕信息平安管理委员会
信息平安管理委员会由##管理层、有关部门总经理组成,负
责审核应急处理小组提交的重大事件处理方案、业务持续性方案
及应急预案。
联系人部门职务联系方式
齐*##副总经理
森*##副总经理
李*##运行部部门总经理
官*##实施部部门总经理
页脚下载后可删除,如有侵权请告知删除!:.
吉*##技术参谋
柴*##技术参谋
〔二〕应急处理小组
应急处理小组由##运行部、##开发部相关人员组成,主要
职责有:
1、应急事件处理
详细记录并分析网上银行应急事件,在技术支持等小组的协
助下,提出解决方案,并向信息平安管理委员会解释应急事件及
解决方案。解决方案通过委员会审核后,应急处理小组还应负责
方案的实施,并在实施完毕后提交“应急事件处理报告〞。
2、业务持续性方案及应急预案优化
负责上报产生的应急事件,评估网上银行业务的持续性方案
及应急预案,当发现存在风险隐患时,对应急预案进展优化。优
化后的业务持续性方案及应急预案须提交信息平安管理委员会
审核后实施。
联系人部门职务联系方式
##运行部业务支持工程师
##运行部业务支持工程师
##运行部业务支持工程师
##运行部业务支持工程师
##运行部业务支持工程师
##运行部业务支持工程师
〔三〕技术支持小组
页脚下载后可删除,如有侵权请告知删除!:.
技术支持小组由##技术部、##开发部相关人员组成,负责
通过远程支持/现场支持的方式,协助应急处理小组提出技术解决
方案。
联系人部门职务联系方式
##实施部大区经理
##实施部大区经理
##实施部大区经理
##实施部专家组,工程经理
##运行部工程成员
##实施部专家组
##实施部专家组
##实施部网站组
##实施部网站组
〔四〕事件宣告小组
网上银行事件宣告小组由***银行办公室等相关部门组成,发
生应急事件后,负责按指定的方式对外发布事件状况、事件处理
进度及事件处理结果。
联系人部门职务联系方式
***银行办公室主任
***银行办公室副主任
三、应急事件定义及响应流程
〔一〕网上银行事件分类
页脚下载后可删除,如有侵权请告知删除!:.
根据对系统效劳产生影响的程度,网上银行事件可划分为四
种类型:
事件分类事件描述
A类生产系统遭到灾难性消灭,无法提供效劳。
核心业务设施〔包括系统核心中间件效劳器、WEB效劳
器、数据库效劳器及其他业务主机、核心网络设备、磁
B类盘存储系统设备、网络线路等〕发生故障或性能严重下
降,导致网上银行系统效劳出现响应速度异常、业务中
断、无法对外提供效劳。
非核心业务设施〔如RA效劳器、签名验签效劳器及其
他非核心主机、热备冗余主机、非核心硬件网络设备等〕
C类
发生故障或性能下降,导致局部所支持的网上银行应用
系统效劳功能及性能受到影响。
非核心其他设施〔如IDS设备、备份系统、知识库系统、
网上银行托管系统监控平台、处于等待状态的灾备系统
D类
等〕发生故障,或者外围设备出现故障,但不会对网上
银行系统业务产生影响。
〔二〕网上银行事件级别
根据各类事件导致网上银行发生故障的时间长短,将事件划
分为四级,级别越高,时间越他,严重程度越高。
事件级别
事件分类
一级二级三级四级
A类---发生即四级
B类--
页脚下载后可删除,如有侵权请告知删除!:.
C类-0-1小时1小时以上
D类1-4小时4小时以上
〔三〕应急预案响应流程
为保证系统平安,由##运行部人员7*24小时值守,对网上
银行系统运行情况实施无连续监控。
应急处理小组成员应保持7*24小时开机,出现紧急事件时,
在第一时间赶赴现场,并协调相关资源,启动应急预案。
各个级别事件的处理流程:
级别处理流程
1、四级事件需由信息平安管理委员会全体成员参与讨论并审
核技术解决方案;
2、事件处理完毕,由应急处理小组提交“应急事件处理报
告〞,并提交信息平安管理委员会审核;
四级3、根据本次事件情况,应急处理小组应对业务持续性方案与
应急预案进展评估,如需优化,那么在优化后提交信息平安
管理委员会审核;
4、根据“应急事件处理报告〞,应急处理小组将本次事件的
处理过程录入知识库系统。
1、三级事件需由信息平安管理委员会中的部门总经理参与讨
论并审核技术解决方案;
2、事件处理完毕,由应急处理小组提交“应急事件处理报
三级
告〞,并提交信息平安管理委员会审核;
3、根据本次事件情况,应急处理小组应对业务持续性方案与
应急预案进展评估,如需优化,那么在优化后提交信息平安
页脚下载后可删除,如有侵权请告知删除!:.
管理委员会审核;
4、根据“应急事件处理报告〞,应急处理小组将本次事件的
处理过程录入知识库系统。
1、二级事件需要由信息平安管理委员中的部门副总经理或以
上人员审核技术解决方案;
2、事件处理完毕,由应急处理小组提交“应急事件处理报
告〞,并提交信息平安管理委员会审核;
二级3、根据本次事件情况,应急处理小组应对业务持续性方案与
应急预案进展评估,如需优化,那么在优化后提交信息平安
管理委员会审核;
4、根据“应急事件处理报告〞,应急处理小组将本次事件的
处理过程录入知识库系统。
1、一级事件需由信息平安管理委员会中的运营主管或以上级
别人员审核技术解决方案;
2、事件处理完毕,由应急处理小组提交“应急事件处理报
告〞,并提交信息平安管理委员会审核;
一级3、根据本次事件情况,应急处理小组应对业务持续性方案与
应急预案进展评估,如需优化,那么在优化后提交信息平安
管理委员会审核;
4、根据“应急事件处理报告〞,应急处理小组将本次事件的
处理过程录入知识库系统。
〔四〕事故防范措施
为防止网上银行意外事故的发生,特制定以下措施:
1、由##运行部人员7*24小时不连续监控网上银行系统,
页脚下载后可删除,如有侵权请告知删除!:.
保证在出现灾难或故障时能够立即响应;
2、生产系统所有的效劳器、网络设备和局域网络通讯线路
均采用主热备方案,发生任意单点故障时可自动切换,不会影响
业务;假设主热备同时发生故障,运维人员应紧急通知应急处理
小组,由应急处理小组提供业务恢复方案,经信息平安管理委员
会同意后执行;
3、为应对黑客入侵,生产系统安装有“入侵检测〞软件,
当发现有恶意攻击时会立即切断网络连接,保护生产系统;
4、为保证系统正常运行,由运行部工程师每月将运行日志
提交给运营维护团队,由维护团队实施业务持续性方案与应急预
案的优化;
5、机房自备有柴油发电机和UPS电源,其中UPS电源采
用双路互备机制。当外部供电中断时,由人工启动柴油发电机继
续为生产系统供电,柴油储藏可至少使用24小时;
6、机房采用封闭式构造,外部包有防电磁信号泄漏层,内
部安装有门禁、消防、闭路摄像、空调等物理环境控制系统。机
房实施区域授权访问控制制度,核心区域需至少两人在场才能同
时进入,以有效应对水灾、火灾以及非法闯入者的破坏。
四、应急预案
〔一〕意外灾害应急预案
1、工作目标
〔1〕在灾害及影响时间较长的情况下,立即启用灾备系统
接收生产效劳;
〔2〕抢救重要资料和设备,在灾情完毕后使用备份数据恢
页脚下载后可删除,如有侵权请告知删除!:.
复生产系统。
2、工作程序
〔1〕值守人员发现灾情后,应立即向应急处理小组汇报情
况;
〔2〕应急处理小组在接到汇报后,在保证平安的情况下,
立即赶赴现场,评估灾难损失,并联系技术支持小组及各相关公
司,提出灾难恢复方案;
〔3〕灾情控制后,应急处理小组立即开展系统恢复工作,
检查系统的损坏程度,根据具体情况采取相应措施:
a、利用冗余设备进展系统恢复,或联系设备供给商提供备
用设备;
b、出现线路故障,立即联系网络供给商启用临时线路;
c、运行平台中的所有主机均采用双机热备,当主节点出现
故障时,由备节点接收效劳。如果主备节点均故障,那么立即联
系设备供给商提供备用主机;
d、当磁盘阵列损毁,导致生产数据无法恢复时,应立即联
系设备供给商提供备用设备,并使用灾备系统中实时备份的数
据,恢复生产系统数据;
〔4〕在确定短期内无法恢复生产系统的情况下,由应急处
理小组启用灾备系统,接收生产效劳;
〔5〕对系统进展测试,测试结果正常由对外恢复系统使用;
〔6〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔7〕根据本次事故情况,应急处理小组对应急预案进展评
页脚下载后可删除,如有侵权请告知删除!:.
估与优化。
〔二〕电力中断应急预案
1、工作目标
〔1〕保证生产系统不受影响;
〔2〕出现主供电线路电力中断时,应及时联系负责人,启
用备用供电系统;
〔3〕机房备有柴油发电机和UPS电源,其中UPS电源采
用双路互备机制。当外部供电中断时,由人工启动柴油发电机继
续为生产系统供电,柴油储藏可至少使用24小时。
2、工作程序
〔1〕值守人员发现主供电线路电力中断时,应立即联系机
房负责人,马上启用备用供电;
〔2〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔3〕根据本次事件情况,应急处理小组对应急预案进展评
估与优化。
〔三〕网络故障应急预案
1、工作目标
在最短时间内恢复生产运行。
2、工作程序
〔1〕值守人员按照系统监控手册要求每隔2小时检查网络
与主机设备运行状况,出现故障立即向应急处理小组报告;
〔2〕应急处理小组立即赶赴现场,并与网络设备供给商、
网络线路供给商取得联系,分析排查故障原因,提出解决方案;
页脚下载后可删除,如有侵权请告知删除!:.
〔3〕假设超过2小时仍无法恢复生产,应急处理小组应提
交申请,启用灾备系统来接收生产效劳;
〔4〕生产系统恢复后,应急处理小组应组织相关人员校验
数据完整性,校验通过后,将应用切换至生产系统;
〔5〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔6〕根据事件情况,应急处理小组对应急预案进展评估及
优化。
3、系统组成
设备种类设备名称
交换机互联网段交换机
交换机2网段交换机
交换机3网段交换机
交换机4网段交换机
防火墙互联网段防火墙
防火墙2-3网段防火墙
防火墙3-4网段防火墙
路由器4网段路由器
负载均衡器2网段负载均衡器
4、故障种类及解决方法
〔1〕网络连接异常
1、问题现象
a、网络线路或设备出现故障时,会导致效劳器、设备无法
连接,系统运行时出现如“提示页面不存在〞等错误;
页脚下载后可删除,如有侵权请告知删除!:.
b、网络线路故障时,也可能导致备份失败。
2、故障分析
a、网络线路异常导致网络连接异常;
b、网络设备接口异常导致接入该接口的设备无法连接;
c、效劳器运行状态异常导致该效劳器无法连接;
d、网络设备故障导致接入该设备的效劳器无法连接。
3、解决方法
a、确认异常
将监控客户端连接到相应网段交换机,根据各设备IP地址,
进展PING操作,观察设备是否可正常连接。
b、异常排查
假设设备无法PING通,作相应的排查。
当连接到交换机、路由器上的所有效劳器都无法连接时,可
判断为交换机、路由器设备异常。先重启交换机、路由器。假设
重启后所有效劳器仍无法连接,需要联系技术支持小组、网络设
备供给商作进一步分析。
假设连接到该网络设备的效劳器,有局部可连接,局部不可
连接,那么有可能是接口异常或效劳器异常。假设更换接口后,
连接正常,那么为接口异常,可暂时更换接口解决问题。假设更
换接口后仍无法连接,那么为效劳器异常,此时应通过控制台连
接效劳器,查看效劳器状态,假设效劳器已停顿运行,重启效劳
器。
〔2〕专线网络中断
a、问题现象
页脚下载后可删除,如有侵权请告知删除!:.
专线网络中断,***银行用户无法登录网上银行。但##内部
网络仍可正常登录系统。通过路由检测会发现,***银行无法正常
路由至##效劳器。
b、故障分析
该问题是由网络线路供给商的网络故障所致。
c、解决方法
联系网络线路供给商,分析排查网络故障,在必要情况下,
启动备用专线网络。
〔四〕硬件故障应急预案
1、工作目标
在最短时间内恢复生产运行。
2、工作程序
〔1〕当效劳器硬件设备出现故障,导致无法连接时,网上
银行托管系统监控平台会自动报警。值守人员在接到报警后,立
即联系应急处理小组;
〔2〕应急处理小组立即赶赴现场,并与效劳器及硬件设备
供给商取得联系,分析排查故障原因,并提出解决方案;
〔3〕如果超过2小时仍无法恢复生产,那么由应急处理小
组提交申请,启用灾备系统接收生产效劳;
〔4〕生产系统恢复后,应急处理小组应组织相关人员校验
数据完整性,校验通过后,将应用切换至生产系统;
〔5〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔6〕根据本次事故情况,应急处理小组对应急预案进展评
页脚下载后可删除,如有侵权请告知删除!:.
估与优化。
3、系统组成
设备种类设备名称
WebServer效劳器个人网上银行WebServer效劳器
WebServer效劳器企业网上银行WebServer效劳器
WebServer效劳器内部管理平台WebServer效劳器
验签效劳器格尔验签效劳器
Ra效劳器Ra效劳器
中间件效劳器Weblogic效劳器
数据库效劳器Oracle效劳器
备份效劳器VERITAS效劳器
光纤交换机IBM光纤交换机
盘阵IBM盘阵
带库IBM带库
4、故障种类及解决方法
〔1〕主机无法登录
a、现象描述
telnet、控制台均无法登录主机,通过切换交换机接口测试,
已排除交换机接口故障。
b、故障分析
可能是由于操作系统损坏或硬件故障等。
c、应急措施
先重启效劳器。假设效劳器无法正常重启,应立即与应急技
术支持小组、效劳器供给商联系,分析故障原因。
页脚下载后可删除,如有侵权请告知删除!:.
〔五〕系统软件故障应急预案
1、工作目标
在最短时间内恢复生产运行。
2、工作程序
〔1〕当系统软件出现性能异常或故障时,网上银行托管系
统监控平台会自动报警。值守人员在接到报警后,应立即联系应
急处理小组;
〔2〕应急处理小组立即赶赴现场,并与系统软件技术支持
人员取得联系,进展故障分析排查,并提出解决方案;
〔3〕如果超过2小时仍无法恢复生产,那么由应急处理小
组提交申请,启用灾备系统接收生产效劳;
〔4〕生产系统恢复后,应急处理小组应组织相关人员校验
数据完整性,校验通过后,将应用切换至生产系统;
〔5〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔6〕根据本次事故情况,应急处理小组对应急预案进展评
估与优化。
3、系统组成
设备名称系统软件
个人网上银行WebServerLinuxRedHatAS4
企业网上银行WebServerLinuxRedHatAS4
内管WebServerLinuxRedHatAS4
Ra效劳器LinuxRedHatAS4
页脚下载后可删除,如有侵权请告知删除!:.
VERITAS效劳器Windows2003Server
4、故障种类及解决方法
系统软件主要故障种类为:CPU利用率异常、内存异常、IO
异常、磁盘空间缺乏等。
〔六〕应用软件故障应急预案
1、工作目标
在最短时间内恢复生产运行。
2、工作程序
〔1〕当应用软件出现性能异常或故障时,网上银行托管系
统监控平台会自动报警。值守人员在接到报警后,应立即联系应
急处理小组;
〔2〕应急处理小组立即赶赴现场,并与应用软件厂商技术
支持人员及##开发部、技术部取得联系,分析排查故障原因,并
提出解决方案;
〔3〕如果超过2小时仍无法恢复生产,那么由应急处理小
组提交申请,启用灾备系统接收生产效劳;
〔4〕生产系统恢复后,应急处理小组应组织相关人员校验
数据完整性,校验通过后,将应用切换至生产系统;
〔5〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔6〕根据本次事故情况,应急处理小组对应急预案进展评
估与优化。
页脚下载后可删除,如有侵权请告知删除!:.
3、系统组成
软件种类软件组成
个人网上银行WebServer
企业网上银行WebServer
内管WebServer
网上银行托管效劳平台个人网上银行AppServer
生产系统企业网上银行AppServer
内管AppServer
Weblogic管理效劳器
数据库
Ra系统RaAppServer
VeritasVeritas效劳器
4、故障种类及解决方法
数据库异常包括:归档日志空间缺乏、数据库对象失效、数
据库无法连接、数据库性能异常等。
中间件异常包括:托管效劳器无法连接、管理效劳器无法连
接、内存溢出、RA效劳器异常等。
网上银行托管效劳平台异常包括:系统登录异常、数据异常
等。
〔七〕病毒感染应急预案
1、工作目标
在最短时间内恢复生产系统运行。
2、工作程序
〔1〕当值守人员发现病毒警报时,应立即向应急处理小组
页脚下载后可删除,如有侵权请告知删除!:.
报告;
〔2〕应急处理小组立即赶赴现场,并隔离染毒的主机和网
络,使用备份机替换染毒的主机;
〔3〕对染毒的主机及网络查杀病毒;
〔4〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔5〕根据本次事故情况,应急处理小组对应急预案进展评
估与优化。
〔八〕非法入侵应急预案
1、工作目标
消除造成的威胁,防止和减少损失,并优化入侵检测及拦截
策略。
2、工作程序
〔1〕发现非法入侵后,应立即向应急处理小组报告;
〔2〕应急处理小组根据当前的入侵检测情况,估计可能的
损失,判断是否需要将系统离线,同时联系技术支持小组、平安
产品厂商及平安技术参谋。
〔3〕分析入侵威胁的来源和方式,由技术支持小组、平安
产品厂商、平安技术参谋等相关人员协同确定解决方案并实施。
〔4〕应急处理小组提交“应急事件处理报告〞,通过审核
后,将相关信息录入知识库系统;
〔5〕根据本次事故情况,应急处理小组对应急预案进展评
估与优化。
五、应急测试与演练
页脚下载后可删除,如有侵权请告知删除!:.
通过合理、完善的测试,可及时发现应急预案存在的缺乏,
并作相应优化。同时,为确保出现紧急事件时,各小组成员能高
效、准确地按应急预案处理事件,需定期作应急演练。
〔一〕应急测试
1、测试内容
〔1〕应急处理团队各小组间配合协调情况;
〔2〕故障解决方案的准确性;
〔3〕生产系统恢复后,检验数据的正确性和运行效率;
〔4〕灾备系统接收后,检验数据的正确性与运行效率;
〔5〕与各会员行间的协调情况;
〔6〕外部资源的协调情况。
2、测试流程
〔1〕应急处理小组制定测试方案,提交信息平安管理委员
会审核。测试方案应涵盖应急预案中涉及到的各项内容;
〔2〕各小组按照测试方案作测试与演练,并提交测试演练
报告;
〔3〕根据测试演练报告,各小组评估应急预案存在的问题,
由应急处理小组作相应优化。
〔二〕应急演练
1、模拟演练
模拟演练在虚拟环境及测试环境进展。通过模拟演练,可以
最大程度测试各灾难场景的应急预案实施过程。模拟演练时,应
根据实际情况设定场景,并由各小组按照应急预案,在虚拟环境
及测试环境作仿真演习。
页脚下载后可删除,如有侵权请告知删除!:.
模拟演练每年至少进展一次。
2、实战演练
实战演练目的在于在生产系统上测试系统的容灾能力及灾
备切换能力。实战演练前,必须充分评估风险,以保证不影响系
统的正常运行。
六、培训
为使应急处理小组各成员充分掌握业务持续性方案及应急
预案,保证应急预案顺利执行,每年至少作一次培训。
页脚下载后可删除,如有侵权请告知删除!
网上银行业务持续性计划与应急预案 来自淘豆网m.daumloan.com转载请标明出处.