背景及5个W
WHAT: VeloCloud Orchestrator Disaster Recovery (DR) 灾备模式部署
WHO: 针对VCO提供容灾方案
WHERE: VCO部署在数据中心内
WHY: VCO保存有全网设备配置信息和最近一年全网的网络状态数据库,如果出现宕机且没有备份,将会对全部的SD-WAN失去控制,因此需要异地灾难备份机制
WHEN: 一旦Active VCO彻底失效(如机房断电,网络全断等极端情况),需要Standby VCO接管整个SD-WAN网络
什么是High Availability (HA)和Disaster Recovery (DR):
HA一般认为是一主一备,当主节点出现问题时,可以及时的切换到备节点,当主节点恢复后,也可以切换回来
DR则是灾备模式,当主节点出现问题且不可恢复后,只能将业务切换至备节点
通过本文档,您将了解到:
- 如何部署和配置VCO的灾备模式
- 两台灾备模式的VCO之间如何通讯
- 常见报错和解决方法
VCO灾备的建立流程
- 将两台独立(Standalone)的VCO分别部署在两个数据中心(IDC),并使用不同的公网IP映射,提供访问
- 两台VCO建立DR,两个数据中心没有DCI的线路互联
- 首先Active VCO会去访问Standby VCO,并用提前设置好的Operator SuperUser级别的账户进行登录
- 认证完成后,Standby VCO会访问Active VCO的地址,并通过TCP 22端口建立SSH通道

配置过程
软件版本:
VCO build 3.4.3 (R343-20200804-GA-51e42f445a)
Tips:需要VCO软件版本一致
IP地址:
模拟暴露在公网的IP | |
Active VCO(主VCO) | 192.168.50.100 |
Standby VCO(备VCO) | 192.168.51.200 |
准备工作:
准备管理员账户
分别在两台VCO上新建Operator SuperUser账户专门用于灾备模式部署
- 主VCO新建账户replica@vmware.com

- 备VCO也新建账户replica@vmware.com,此处最好账户名和密码与主VCO一致,减少后续出现问题的可能

设置VCO的系统参数
- 分别在两台VCO的System Properties中设置network.public.address地址
- 以Active VCO为例,Standby VCO也按照下述步骤操作


配置阶段:
将Standby VCO置为Standby模式

Standby VCO处于Standby状态成功,处于Standby Candidate状态

配置Active VCO,填入Standby Orchestrator Address / Standby VCO UUID / SuperUser username,password,使用Auto Configure Standby

确认Standby VCO的数据库将会被清空

主备同步:

如果没有问题,最终会同步完成,由于实验环境的问题,Edge和Gateway没有连接到Standby VCO,不过数据库已经同步成功

具备裸光纤互联的双数据中心
不需要通过VCO的业务接口进行同步,而可以通过第二网卡来进行同步

前期准备工作类似,只是需要多配置一个网卡和系统属性
为Active和Standby VCO在vSphere上分别各增加一个网卡,并在VCO的虚机上配好IP,在System Properties中新建network.replication.address,并输入第二网卡的IP


同样,先启用备VCO的Standby,可以看到Orchestrator Secondary Address为10.1.1.2

主VCO上填写对应的参数,需要多填一个Secondary Address 10.1.1.2

同步完成后,可以看到同步是通过第二网卡的IP来完成的

在VCO上看socket连接,10.1.1.1:SSH是被10.1.1.2的备VCO连接的,192.168.50.100的SSH是管理的socket

常见报错
没有配置network.public.address

VCO版本不匹配
