灾备网

www.zaibei.net,专业灾备网站,灾备行业门户。
当前位置:首页-技术方案-分布式双活数据中心技术体系

分布式双活数据中心技术体系

发布时间:2016-03-06 12:43 来源:灾备网 我要投稿

数据中心网络系统只是数据中心总体IT系统的一个组成部分,建设分布式双活数据中心需要网络、计算、存储等多个IT系统之间紧密合作才能实现。分布式双活数据中心的技术体系内容非常丰富,从数据中心前端的全局负载均衡(GSLB)到服务器前端的负载均衡(SLB)和服务器集群HA技术,再到后端的数据库系统和存储系统技术,涉及数据中心整体解决方案的方方面面。

分布式双活数据中心在传统“两地三中心”模式的基础上,针对不同双活模型部署不同的技术。基于IP地址发布业务的数据中心在前端网络的Ingress方向(客户端到服务器)上需要设备支持RHI特性,在Egress方向(服务器到客户端)上需要配置网关分离。在数据中心后端需要部署服务器负载均衡与HA,以及数据分布式双活技术。基于域名发布业务的数据中心在前端网络需要采用全局负载分担设备(GSLB)进行选路。以下将对各类实现方式与技术进行介绍分析。

1 数据中心前端分布式双活网络技术

在分布式双活数据中心网络环境下,通过数据中心前端分布式双活技术,用户能快速访问“距离最近”的可用数据中心相对应的业务,提高服务响应速度,提升用户访问体验。数据中心的业务对外发布时,可以采用纯IP地址也可以采用DNS域名方式。根据业务对外发布方式的不同,数据中心前端也相应采用不同的技术实现分布式网络双活。

1.1 纯IP地址方式发布业务的前端网络双活技术

如图1所示,当业务采用纯IP方式对外发布时,正常情况下只有主中心DC A对外发布业务路由,从而将用户访问流量牵引到主中心,实现主中心业务访问。而备中心DC B的流量管理设备(支持RHI特性)只探测业务地址,因没有探测到而不对外发布业务路由,实现主中心的备份作用。

图1. 纯IP地址方式发布业务正常情况由主中心提供业务

当主中心业务迁移到备中心后,备中心的流量管理设备探测到业务IP已经转移到备中心,从而对外发布业务路由,引导用户访问备中心的业务IP,从而实现基于纯IP发布业务的数据中心前端网络双活。

值得注意的是,该方案需要备中心流量管理设备支持RHI特性(如图2所示),能够对外发布路由。数据中心间需配置网关分离(如采用ACL方式对相关报文进行控制)。若数据中心互联采用EVI方式,则天然支持网关分离,无需配置。

 

图2. 纯IP地址方式发布业务备中心接管业务

1.2 域名方式发布业务的前端网络双活技术

当业务系统基于DNS域名方式对外发布时,可以采用基于智能DNS解析的GSLB[1]。GSLB解决了第一步即引导数据中心前端广域网用户流量访问适当的数据中心问题,所以GSLB的应用环境往往是基于域名的多数据中心之间的负载分担和相互之间的容灾备份。

 

图3. DNS方式GSLB的基本模型

(如图3所示)GSLB 基于DNS的流量管理机制主要完成DNS解析请求的负载均衡、服务器状态监控、用户访问路径优化。用户访问应用时,域名解析请求将由GSLB负责处理,它通过一组预先定义好的策略,将最接近用户的节点地址提供给用户,使其可以得到快速的服务。同时,它还与分布在各DC的所有GSLB节点保持通讯,搜集各节点的健康状态,以保证不将用户的请求分配到任何一个已经不可用的节点上。GSLB 通过就近探测实现负载分担(如图4所示)。

图4. GSLB就近探测原理

数据中心A、B、C各部署一个GSLB,其中DC A的GSLB为主GSLB,响应流程如下:

1. Local DNS向主GSLB发起域名解析请求;

2. GSLB-A、GSLB-B、GSLB-C将访问local DNS的延迟时间等相关信息返回给GSLB-A汇总,并判断最优的地址返回给local DNS;

3. 以站点的响应时间作为引导用户的依据,用户的访问请求被导向到性能好,响应时间快的站点。

DNS方式的GSLB主要功能和特性如下:

应用智能:感知应用,及时发现业务中断;

可管理:自动切换,通知用户改变数据访问点;

高性能:支持流量在数据中心的动态负载均衡。 

2 服务器负载均衡与HA技术

为了保证分布式双活数据中心的持续业务提供能力,需要在后端采用服务器负载均衡与HA技术,和前端网络双活配合,实现服务资源的调配和高可用保证。

2.1 服务器负载均衡

为了满足高性能和高可靠性的服务需求,将多台服务器通过网络设备相连组成一个服务器集群,每台服务器都提供相同或相似的网络服务。服务器集群前端部署一台SLB[2] 设备,负责根据已配置的均衡策略将用户请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。

服务器负载均衡可以工作在L4或L7模式下,一般采用L4模式。负载均衡的工作方式有以下两种。

DR(Direct Routing)方式。(如图5所示)负载均衡设备对数据流量优化时,采用旁挂方式部署,在此模式下只有客户端的请求报文通过负载均衡设备,服务器的响应报文不经过负载均衡设备,从而减轻负载,有效的避免了其成为网络瓶颈。客户端请求报文的目的地址为虚服务地址(VSIP),此地址由负载均衡设备对外呈现。负载均衡设备分发服务请求时,不改变目的IP地址,而将报文的目的MAC替换为实服务的MAC后直接把报文转发给实服务。

图5. DR方式的服务器负载均衡

NAT方式。(如图6所示)组网更加灵活,后端服务器可以位于不同的物理位置或不同的局域网内。客户端将发往VSIP的请求发送至服务器群前端的负载均衡设备,负载均衡设备上的虚服务接收客户端请求,根据持续性功能、调度算法依次选择真实服务器,再通过网络地址转换,用真实服务器地址重写请求报文的目标地址后,将请求发送给选定的真实服务器;真实服务器的响应报文通过负载均衡设备时,报文的源地址被还原为虚服务的VSIP,再返回给客户,完成整个负载调度过程。

图6. NAT方式的服务器负载均衡

一般情况下,SLB更加适合在一个数据中心内部部署,而不是跨数据中心部署。因为当SLB跨数据中心部署时,会导致跨中心的广域/城域链路承载流量多,而且跨中心转发一般延迟高,流量路径复杂低效,不利于实现高性能的负载均衡集群(如图7所示)。而GSLB更加适合实现跨数据中心的负载均衡,所以GSLB和SLB配合能够很好的实现从数据中心前端到数据中心内部全路径的负载均衡,以及更好的实现服务器健康状态检测(如图8所示),主要包括:

GSLB可针对SLB、服务器做状态监测,可消除单点故障,并引导流量避开性能较低的站点和服务器;

通过收集这些设备的性能测量数据,GSLB可了解网络状态,对包速率、每秒千字节、磁盘、内存、CPU 利用率以及连接数量等参数进行测量。

图7. SLB跨中心部署

图8. GSLB和SLB配合实现服务器健康状态检测 

2.2 服务器HA技术

高可用性集群(High Availability Cluster,HA Cluster)是以减少服务器中断时间为目的实现故障屏蔽的服务器集群技术,主要包括可靠性和容错性两方面。在这种高可用集群环境下,若某台服务器出现故障导致服务中断,预先设定的接管服务器会自动接管相关应用并继续对用户提供服务,具有更高的可用性、可管理性和更优异的可伸缩性。HA Clusters是可用于“热备模式容灾”的集群技术(如表1所示),其技术特点是:

需要共享存储资源(磁盘卷或是复制卷),HA集群可在同城或较近距离内部署;

对客户端来说,集群只有一个IP地址,由Active节点响应ARP;

需要一个独立的网络做节点之间的进程通信(心跳);

心跳网络对传输延迟不敏感(如微软MSCS要求的最小心跳间隔是1秒),因此两节点间的传输延迟小于500ms即可;

因为对外只有一个虚IP地址,所有节点需在一个网段(二层互联);

双节点的高可用性集群典型的工作方式有以下两种。

主/主( Active/Active) 。集群中两节点同时运行各自的应用并且相互监控对方的情况, 当一台主机宕机后,预先设定好的另一台主机立即接管它的一切工作。这种工作方式允许最大程度的利用硬件资源,一般要求各节点具有相等或相似的处理能力,所有的服务在故障转移后仍保持可用。

主/从( Active /Standby) 。主机工作,从机处于监控准备状况。当主机宕机后,从机接管主机的一切工作,继续为客户机提供服务,待主机恢复正常后,用户可以自行设定以自动或手动方式将服务从Standby 上切换到Active 上,也可不切换。