巴西海通银行 HyperBDR 容灾最佳实践
巴西海通银行 HyperBDR 容灾最佳实践
一、项目概述
1.1 客户与场景
| 维度 | 说明 |
|---|---|
| 客户 | 巴西海通银行 |
| 行业/区域 | 金融业,受欧盟监管的银行,业务遍及伊比利亚、英国、波兰、法国、巴西和中国澳门 |
| 业务特点 | 提供结构性融资、资本市场、并购咨询、债券、公司衍生品和资产管理等专业服务 |
| 关键系统 | 数据库系统、文件存储服务系统、投资银行相关业务系统 |
| 业务系统规模 | 16台主机,存储约8.7TB |
| 源端环境 | 本地VMware环境 |
| 容灾目标 | RTO < 30分钟,RPO 4~24小时(根据业务系统等级) |
本项目是金融行业 VMware 到华为云容灾的典型场景,适合作为金融行业容灾上云的参考案例。
1.2 HyperBDR 在本项目中的核心价值
- Boot in Cloud(云端启动):支持一键云端拉起业务系统到可用状态,无需在云端1:1预启动实例,大幅降低容灾成本
- VMware Agentless(无代理迁移):源端VMware主机无需逐台安装代理,最小化源端业务系统影响
- 组合存储策略:数据库和文件存储系统采用块存储实现分钟级恢复,其他业务系统采用对象存储降低存储成本
二、业务挑战与 HyperBDR 的应对
金融行业容灾往往面临以下挑战,本项目通过 HyperBDR 提供解决方案:
| 挑战 | 说明 | HyperBDR 的应对 |
|---|---|---|
| 原有方案不满足容灾需求 | 业务系统运行在本地VMware环境中,原有本地备份产品不具备异地灾备和云灾备能力 | HyperBDR提供完整的云容灾解决方案,支持VMware到华为云的异地容灾 |
| 严格的RTO/RPO要求 | 金融行业监管要求RTO < 30分钟,RPO根据业务系统等级规划4~24小时不等 | 通过Boot in Cloud技术实现分钟级RTO,通过策略化同步满足不同RPO要求 |
| 容灾成本控制 | 传统容灾方案需要在云端1:1预启动实例,成本高昂 | Boot in Cloud技术无需预启动实例,对象存储降低存储成本,整体TCO降低50% |
| 最小化生产环境影响" | 金融业务系统对稳定性要求高,不允许在源端进行侵入性操作 | 采用Agentless模式,通过VMware API直接访问,无需在源端安装代理 |
这些挑战在多数金融行业容灾场景中具有共性,因此本项目展示的 HyperBDR 能力具有可复用的最佳实践价值。
三、HyperBDR 方案与架构
3.1 总体思路
本项目采用HyperBDR将巴西海通银行本地VMware环境中的16台业务主机容灾到华为云,根据业务系统重要性采用组合存储策略:数据库和文件存储系统(数据量较大)采用块存储方式数据同步,实现业务恢复时间小于10分钟;其他业务系统的主机采用对象存储方式同步数据,满足RTO小于30分钟需求的同时降低容灾备份阶段的存储成本。
3.2 架构要点
- 生产端:本地VMware环境,运行16台Windows Server虚拟机,包括数据库服务器、应用服务器和文件服务器
- 灾备端:华为云sa-brazil-1区域,采用多种云主机规格(c3.large.4、s6.xlarge.2、m7n.xlarge.8等)
- 存储层:数据库和文件存储系统使用块存储,其他业务系统使用对象存储作为中间层
- 复制关系:采用增量同步模式,快照间隔1小时,快照配额128,支持策略化同步
3.3 HyperBDR 核心能力在本项目中的体现
| HyperBDR 能力 | 在本项目中的应用 | 价值 |
|---|---|---|
| Boot in Cloud | 支持一键云端拉起业务系统到可用状态,无需在云端1:1预启动实例 | 大幅降低容灾成本,TCO降低50% |
| VMware Agentless | 源端VMware主机无需逐台安装代理,通过VMware API直接访问 | 最小化源端业务系统影响,降低部署复杂度 |
| 策略化同步 | 根据业务系统重要性配置不同的同步策略,快照间隔1小时 | 满足不同业务系统的RPO要求(4~24小时) |
| 组合存储策略 | 数据库和文件存储系统采用块存储,其他业务系统采用对象存储 | 平衡恢复性能和存储成本,关键系统<10分钟RTO,其他系统<30分钟RTO |
| 自动化驱动适配 | 自动适配华为云架构驱动,无需手动干预 | 提高恢复成功率,降低运维复杂度 |
四、实施要点与演练最佳实践
4.1 数据复制阶段
在演练前的数据复制阶段,本项目采用增量同步策略:
- 增量同步模式:仅传输变化的数据块,减少网络带宽占用
- 快照间隔1小时:每小时创建一次快照,确保数据恢复点
- 快照配额128:保留128个快照版本,支持长期数据保留
- 策略化同步:根据业务系统重要性配置同步策略
数据复制过程是持续进行的,为后续演练和接管提供数据基础。当前项目状态:5台主机同步中,11台主机同步快照完成。
4.2 演练与接管阶段最佳实践
演练和接管是验证容灾方案有效性的关键环节。本项目采用Boot in Cloud一键拉起方式,以下是演练过程中的详细步骤和最佳实践:
4.2.1 演练前准备
| 步骤 | 时间 | 关键动作 | 目的 |
|---|---|---|---|
| 环境检查 | 演练前1天 | 检查华为云资源配额、网络连通性、存储空间 | 确保灾备环境可用 |
| 数据同步验证 | 演练前1天 | 验证所有主机同步状态,确认快照完整性 | 确保数据一致性 |
| 网络规划 | 演练前1天 | 配置演练网络、IP地址规划、DNS配置 | 确保演练网络连通 |
| 编排计划 | 演练前1天 | 制定恢复顺序、依赖关系、并行策略 | 优化恢复时间 |
演练前准备的关键要点:
- 确保华为云区域sa-brazil-1有足够的资源配额
- 验证源端VMware到华为云的网络连通性
- 规划演练网络的IP地址和路由配置
- 制定详细的恢复编排计划,明确依赖关系
4.2.2 演练与接管阶段
| 阶段 | 目标 | 详细步骤与 HyperBDR 关键动作 | 时间与结果 | |------|------|---------|---------------------------|-----------| | 数据库系统恢复 | 优先恢复数据库系统 | 使用块存储的数据库主机(SRBRSPDBS01、SRBRSPDBS03)采用Boot in Cloud一键拉起,自动化驱动适配 | <10分钟完成 | | 应用系统恢复 | 恢复应用服务器 | 应用服务器(TSAPLIC01、SRBRSPAD02、SRBRSPAD03等)并行拉起,对象存储方式 | <30分钟完成 | | 文件存储恢复 | 恢复文件服务 | 文件存储服务器(BESSPSRV19)采用块存储方式拉起 | <10分钟完成 | | 业务验证 | 验证业务可用性 | 进行业务功能测试、数据一致性验证、网络连通性测试 | 验证通过 |
演练过程中的 HyperBDR 最佳实践要点:
- 优先级排序:先恢复数据库系统,再恢复应用系统,最后恢复辅助系统
- 并行恢复:对无依赖关系的应用服务器采用并行恢复策略,缩短整体RTO
- 存储策略优化:关键系统使用块存储实现快速恢复,非关键系统使用对象存储降低成本
- 编排驱动:使用HyperBDR编排能力管理恢复顺序和依赖关系
- 自动化驱动适配:依赖HyperBDR自动适配华为云驱动,无需手动干预
五、关键成果与指标
采用 HyperBDR Boot in Cloud和组合存储策略,在 DR 演练及接管过程中可达到以下效果:
| 指标 | 结果 | HyperBDR 的贡献 |
|---|---|---|
| RTO(关键系统) | <10分钟 | Boot in Cloud一键拉起 + 块存储策略 |
| RTO(非关键系统) | <30分钟 | Boot in Cloud一键拉起 + 对象存储策略 |
| RPO | 1~4小时 | 增量同步 + 1小时快照间隔 |
| TCO | 降低50% | 无需1:1预启动实例 + 对象存储成本优化 |
| 数据同步状态 | 11台完成,5台同步中 | 增量同步策略,持续数据保护 |
| 源端影响 | 最小化 | Agentless模式,无需安装代理 |
说明:不同环境与带宽条件下数值会有差异,但 HyperBDR Boot in Cloud和组合存储策略具备可复制性。
六、项目总结
本项目成功验证了 HyperBDR 在金融行业 VMware 到华为云容灾场景下的有效性,为巴西海通银行实现了合规的容灾方案。项目取得的关键成果如下:
6.1 关键成果
- 满足监管要求:实现RTO < 30分钟、RPO 4~24小时的监管要求
- 成本优化:通过Boot in Cloud和对象存储策略,TCO降低50%
- 最小化生产影响:采用Agentless模式,无需在源端安装代理
- 灵活的存储策略:关键系统块存储,非关键系统对象存储,平衡性能和成本
6.2 项目价值
本项目展示了 HyperBDR 在金融行业容灾场景下的核心价值:
- 合规性保障:满足金融行业严格的RTO/RPO监管要求
- 成本效益:通过云原生架构显著降低容灾成本
- 运维简化:无代理部署、自动化驱动适配降低运维复杂度
- 灵活策略:根据业务重要性配置差异化容灾策略
6.3 典型场景
本项目覆盖了金融行业 VMware 到华为云容灾的典型场景,包括数据库系统、应用系统和文件存储系统的容灾保护,对同类金融客户具有代表性和参考价值。