伴隨著金融行業(yè)數(shù)字化轉(zhuǎn)型的不斷深化,業(yè)務系統(tǒng)的持續(xù)穩(wěn)定運行已成為信息化建設的最基礎訴求。作為業(yè)務連續(xù)性基礎保障的災備建設,也成為各行業(yè)最基礎的運行安全設施。金融系統(tǒng)具有信息化程度高和信息安全需求高兩大特征。以最為嚴格的銀行容災架構(gòu)為例,大部分均完成本地容災或本地+異地容災建設,確保銀行的數(shù)據(jù)不丟,業(yè)務不停。針對這一現(xiàn)狀,美創(chuàng)科技利用美創(chuàng)DRCC災備集中管控平臺,為金融數(shù)據(jù)安全保駕護航。
一、背景分析
但金融機構(gòu)業(yè)務系統(tǒng)復雜多樣,各系統(tǒng)、各數(shù)據(jù)庫采用的容災技術(shù)各不相同;同時各金融機構(gòu)受銀保監(jiān)會、央行等強監(jiān)管。整體來看,目前金融信息中心在災備管理及運營方呈以下現(xiàn)狀:
· 數(shù)據(jù)中心災備實現(xiàn)方式“散、雜、多、亂”;
· 銀保監(jiān)會、央行等監(jiān)管機構(gòu)對責任單位的應急預案有突擊檢查機制;
· 銀監(jiān)會有明確要求:商業(yè)銀行應當至少每三年對全部重要業(yè)務開展一次業(yè)務連續(xù)性計劃演練;
· 不敢“切”,系統(tǒng)故障時的容災切換不能確保業(yè)務的連續(xù)可用;
· 日常演練和應急切換需提交標準報告滿足合規(guī)審計和歸檔要求;
· 容災切換責任大,風險高,需求急,缺乏安全授權(quán)機制;
· 面臨各類監(jiān)管和測評考核要求,缺乏日常容災運營機制。
基于以上現(xiàn)狀分析,為提升金融機構(gòu)應急處置效率,保障災難場景下的容災順利切換和業(yè)務的連續(xù),對于應急切換管理系統(tǒng)建設應基于以下原則:
1、資產(chǎn)統(tǒng)一管控
實現(xiàn)數(shù)據(jù)中心核心容災資產(chǎn)的統(tǒng)一集中納管和監(jiān)控,并實時展示資產(chǎn)運行狀態(tài)以及RPO等信息,并對異常資產(chǎn)提供主動預警機制。
2、一鍵式容災演練和災難切換
平戰(zhàn)結(jié)合,滿足計劃內(nèi)的演練場景和災難時的切換場景下,對容災資產(chǎn)的靈活編排和一鍵切換:
1)面對監(jiān)管部門發(fā)起的突擊式容災演練任務,和計劃內(nèi)的演練任務,支持一鍵容災演練切換,確保在數(shù)據(jù)不丟失情況下的演練切換和一鍵回切;
2)面對數(shù)據(jù)中心災難場景,支持一鍵業(yè)務級容災切換,確保核心業(yè)務連續(xù)運行,保障RTO。
3、報告自動輸出
對演練和切換場景提供過程自動截圖留存、切換報告自動輸出,報告內(nèi)容滿足合規(guī)要求。
4、安全授權(quán)機制
滿足面對內(nèi)外網(wǎng)完全隔離情況下,業(yè)務管理員不在現(xiàn)場的切換任務順利進行;滿足先獲取領導或管理員授權(quán),再進行切換的需求。
5、可視化災備運營
對建設完成的容災系統(tǒng),提供日常運營服務,如搭建切換指揮和狀態(tài)監(jiān)控大屏,實時顯示災備狀態(tài)、應急切換過程和切換時長,給災難發(fā)生時的決策指揮提供有力支撐;提供便捷可視化及可持續(xù)更新的組織容災預案管理能力;提供常態(tài)化桌面演練和一鍵自動切換能力。
二、美創(chuàng)DRCC助力金融應急切換管理系統(tǒng)建設
面對金融行業(yè)的災備建設呈現(xiàn)出多樣性、復雜性、規(guī)?;忍卣?,以及相關監(jiān)管要求和容災管控現(xiàn)狀。美創(chuàng)基于已有的災備集中管控平臺DRCC進行優(yōu)化,持續(xù)匹配金融行業(yè)的應急切換管理需求。
DRCC是一款以業(yè)務連續(xù)性為目標,以業(yè)務系統(tǒng)為視角單元的災備集中管控平臺,具備災備集中管理、故障自動預警,以及應用級一鍵式切換等業(yè)務連續(xù)性保障功能,可有效提升銀行等金融機構(gòu)重要業(yè)務系統(tǒng)災備運維自動化水平及應急響應能力,保障轄內(nèi)業(yè)務系統(tǒng)持續(xù)穩(wěn)定運行。

圖 1美創(chuàng)應急切換管理平臺
DRCC災備集中管控平臺為應急切換管理系統(tǒng)建設提供云-端架構(gòu)的解決方案:支持以DRCC為中心平臺,容災技術(shù)&容災設備為端,實現(xiàn)容災資產(chǎn)管理、調(diào)用和切換,真正做到容災管控平臺化、一體化、智能化。

圖 2美創(chuàng)科技云-端災備管控
DRCC以業(yè)務連續(xù)性時間(RTO)為目標,針對不同類型的災備接入端實現(xiàn)集中管控,并提供切換預案、切換編排、桌面演練、容災演練、災難切換等功能,實現(xiàn)容災切換流程標準化、自動化和可視化,縮短容災切換時間,保證容災切換成功率。
三、實踐路徑
為滿足合規(guī)需求以及真實用戶場景需求,美創(chuàng)DRCC平臺提供從資產(chǎn)接入到容災運營的最佳實踐路徑。

圖 3美創(chuàng)科技容災實踐路徑
1、容災技術(shù)自動發(fā)現(xiàn)
DRCC內(nèi)置數(shù)據(jù)級容災管控能力,用戶將搭建好的容災資產(chǎn)接入平臺后,平臺通過自動檢測技術(shù),實現(xiàn)容災技術(shù)的自動發(fā)現(xiàn),并將發(fā)現(xiàn)后的容災技術(shù)及資產(chǎn)進行列表分類展示,并對添加到平臺的所有資產(chǎn),如:數(shù)據(jù)庫、應用、網(wǎng)絡、中間件、負載均衡、消息隊列等,進行集中式管控。
2、場景化預案輸出
DRCC內(nèi)置行業(yè)災備預案模板,覆蓋常見災難場景。同時支持自定義災備預案內(nèi)容,支持對添加的災備預案進行大屏監(jiān)控和管理,完整的災備預案信息支持導出,滿足歸檔和審計訴求。
3、可視化自由編排
用戶根據(jù)每個業(yè)務流以及實際切換需求進行可視化自由編排。通過切換編排功能,徹底改變了傳統(tǒng)容災產(chǎn)品及方案的運行方式,以所見即所得的模式讓流程的配置更為自由高效。
可視化編排,靈活設計容災切換預案。兼顧并行和串行,支持可視化拖拽,可根據(jù)用戶業(yè)務場景,自由編排。以業(yè)務RTO為目標,持續(xù)優(yōu)化切換流程。切換流程標準化,簡單化,為一鍵切換操作提供基礎。
4、三種演練切換機制
平臺目前提供三種切換演練場景:桌面演練、容災演練以及災難切換:
· 常態(tài)化高頻次的桌面演練,在不影響生產(chǎn)端的前提下,提供了數(shù)據(jù)庫級和業(yè)務級災備端可用性的驗證機制;
· 計劃內(nèi)或滿足上級監(jiān)管部門考核的容災演練能力,在保證數(shù)據(jù)零丟失前提下,驗證災備可用性,通過模擬容災切換實戰(zhàn)的演練過程。
· 災難場景下的一鍵容災切換,創(chuàng)新性的解決傳統(tǒng)容災產(chǎn)品切換過程不完善、切換復雜、流程耗時、易出錯、切換不成功等問題。整個容災切換流程自啟動后全程自動化完成,大大減少了誤操作風險,保障了切換成功率,降低了RTO。
5、切換大屏
平臺提供一鍵切換能力的同時,支持切換過程的可視化展示,提供切換監(jiān)控大屏和切換指揮大屏,支持多人、全局、動態(tài)的切換過程視圖,可以讓領導直觀感知并參與和指揮切換過程,同時為應急場景提供決策依據(jù)。
6、安全授權(quán)機制
基于OTP技術(shù),平臺為現(xiàn)場值班人員、切換負責人員提供切換操作安全授權(quán)能力,確保安全性的同時,保障切換任務順利進行。
7、自動化報告輸出
災備管理工作一方面有內(nèi)容歸檔訴求,要便于審計追溯,另一方面有內(nèi)容標準化要求,便于規(guī)范化管理。面對日常的桌面演練以及容災演練、容災切換過程,自動化的輸出報告,同時支持報告的自定義,便于歸檔和審計。
四、美創(chuàng)DRCC建設價值
一)實現(xiàn)應急切換管理系統(tǒng)建設:提升重要業(yè)務系統(tǒng)運維自動化水平及應急響應能力,保障轄內(nèi)業(yè)務系統(tǒng)安全穩(wěn)定運行,維持各業(yè)務系統(tǒng)長期安全穩(wěn)定運行,避免系統(tǒng)因故障產(chǎn)生服務中斷、業(yè)務數(shù)據(jù)丟失而產(chǎn)生的各類損失。實現(xiàn)災備管理、故障預警及應用系統(tǒng)一鍵式自動應急切換等業(yè)務連續(xù)性保障功能,并且最大程度滿足了RTO和RPO的要求。
二)提高運維效率:無需登錄多個容災平臺和資源挨個進行狀態(tài)查看和配置,滿足所有容災的統(tǒng)一管理和監(jiān)控。
三)降低技術(shù)人員能力要求:預先排好切換手冊,對切換流程進行標準化、規(guī)范化和可視化;切換流程標準化、規(guī)范化、可視化,降低切換操作人員的技術(shù)能力要求。
四)保障業(yè)務連續(xù)性:災難發(fā)生時,通過戰(zhàn)前切換演練,以業(yè)務RTO為目標,持續(xù)優(yōu)化切換流程,縮短切換時間,確保災備快速、成功切換。
五)災備管控可視化:通過大屏可視化,直觀展示散雜多亂的災備運行狀態(tài)。形象展示切換狀態(tài),進程統(tǒng)計,包括切換完成百分比、切換資源數(shù)量、耗時,實時感知切換過程、助力決策指揮。
六)輸出報告且滿足監(jiān)管需求:由于災難切換任務重大,涉及部門眾多,需要事后追溯。DRCC支持自動輸出演練報告,災難切換報告,便于審計和歸檔,同時滿足相關監(jiān)管合規(guī)要求。