当前,大众对网络服务的依赖程度持续加深,众多互联网服务提供商急需实现低延迟且高稳定性的服务。您是否曾遭遇过以下困扰:
1、需要降低网络耗时,却不知道怎么实现用户服务的就近访问?
必须对服务进行灰度测试,但面临难题,不知如何调节各节点流量占比,亦不清楚如何合理分配资源。
明白确保服务功能的有效性至关重要,但面对故障时,却常常困惑于如何迅速将数据流量引导至其他可用的服务点?
您需要全局流量管理产品来帮助您排忧解难。
什么是全局流量管理
阿里云于19年推出了一款名为全局流量管理(简称GTM)的产品。在互联网领域,DNS是应用最广泛的流量调度手段。随着分布式服务技术的进步,主备部署、异地多活等多元节点架构逐渐成为趋势。因此,对业务流量进行高效调度管理,以确保服务具备低延迟和高可用性,显得尤为关键。凭借在阿里经济体长期从事流量调度与管理的丰富经验,以及在不同业务场景——如容灾切换、大规模站点迁移、经济体上云等方面的实际操作,全局流量管理技术得以诞生,并有效助力用户实现对业务流量的高效掌控。
GTM 原理
GTM的核心功能在于利用DNS进行流量分配,其底层依托的是“云解析DNS”与“云监控”这两项服务。这两项服务融合了DNS的智能解析技术以及云监控的应用服务监控能力,从而向客户提供了多种服务:包括根据网络或地区自动实现用户访问的就近接入、对应用服务运行状况的健康性进行检查、以及故障时的自动切换等功能。

图1: GTM原理图
GTM 为用户提供了接入域名 CNAME,该域名与 CDN 接入域名相似,用户需将自身业务域名的 CNAME 设置为该接入域名,以便利用 GTM 的各项功能。此外,用户还需进行地址池(Pool)的配置。
在概念与理论层面,GTM 容易与负载均衡技术(SLB)以及云解析式全局负载均衡(GSLB)产生混淆。
全局流量管理(GTM)与负载均衡(SLB)之间的差异主要体现在以下几个方面:首先,在对比网络层的后端地址时,GTM采用的是加权轮询的方式;其次,在处理跨难度故障时,GTM具有较长的间隔时间;再者,GTM在会话保持方面也有所不同。
GTM
3 层
域名、IP
支持
简单
分钟级
不支持
SLB
4层、7层
IP
支持
困难
秒级
支持
表1:GTM 与 SLB 对比
两者的对比如下表所示:
对比项服务接入健康检查故障切换时间多线路接入链路互备
GTM
CNAME 接入
ping,tcp,http(s)
分钟级,不受子域名 TTL 限制
电信、联通、移动、鹏博士
故障自动切换,可控
GSLB
子域名开启
不支持
受子域名TTL 限制
不支持
随机选择正常链路,不可控
表2:GTM 与 GSLB 对比
GTM 功能特性地址池:
传统的DNS解析指向单一地址,然而GTM引入了地址池这一概念。借助地址池,可以对应用服务的IP地址进行集中管理。此举不仅能够将终端用户的访问解析至应用服务的地址池,还能在高负载时实现流量的均衡分配,以及根据需求进行流量的自定义分配。此外,当整个地址池无法使用时,还可以进行备份和切换操作。
访问策略:
访问策略的核心目的是为了应对基于请求来源和地址池健康状况的地址池转换需求。它不仅能够智能地解析地址池的维度,还能够实现故障时的自动切换功能。
GTM对中国的主要电信服务商、七大区域以及全球六大洲实施智能DNS解析技术,确保来自不同网络和地区的访问者能够实现本地接入,从而有效提升访问效率。
一旦地址池整体出现故障,GTM便会依照用户设定的策略,实施分钟级别的地址池切换;待地址池恢复正常后,GTM会相应地将切换操作撤销。
健康检查:
借助云监控卓越的分布式监控能力,GTM新增加了模块功能,能够从不同地域对地址池内的多个应用服务的IP地址进行健康状况的检测。目前,该模块已实现对http/https、tcp、ping三种通信方式的全面支持。一旦地址池中的地址出现故障,模块能够精确地发现异常,并与DNS进行交互,及时移除故障地址。同时,当故障地址恢复正常后,系统会自动将其恢复至解析返回列表中。
经过测试团队的反复测试和验证,我们发现GTM在应用服务出现故障的情况下,能够在5分钟内成功切换应用服务的约90%流量。GTM的故障切换生效时间由两部分组成,即故障发现时间加上DNS切换同步时间。
目前,系统默认的健康检查设置能够在故障发生后的短短3分钟内,精确地识别出故障的存在。
DNS切换同步时间方面,目前GTM的CNAME接入域名的TTL值设定为60秒,从理论上讲,域名变更后应在60秒内完成更新。然而,具体生效时间还需视我国各地运营商对缓存设置的时长而定。
应用场景
下面以异地双活模式为例,阐述如何利用GTM技术实现高效的灾难恢复切换。具体来看,该服务面向的用户群体包括海外用户与国内用户,其后台服务统一遵循一个部署策略。借助GTM对来自不同区域用户的请求进行智能分配,能够将用户访问流量引导至相应的接入节点,例如,海外用户将访问新加坡数据中心(),而国内用户则访问杭州数据中心(CN-)。遭遇站点故障或灾难情况,各接入节点自行构建相互备份系统,从而确保业务运行的高度可靠性。
图2: GTM 在异地多活中的应用
五步快速接入GTM,实现异地容灾:
(1)全局配置:
基础配置主要包括负载均衡策略的设定、全局TTL值的配置、报警通知组的指定等关键信息。
(2)地址池配置:
创建新的地址池并设置CN-。在每个地址池内,分配了该区域内多个服务的IP地址,并设定了最低可用的地址数。一旦地址池中的活跃地址数量低于预设的数量,该地址池便被视为不可用。另外,还会依据全局配置中的负载均衡策略,自动完成流量的分配。
(3)开启健康检查
对地址池内IP地址的配置进行健康性检测,一旦启用,便能够进行实时的可用性监控。依据地址的可用性状况,系统将自动隔离故障,并向相应的报警团队发送通知。一旦地址恢复正常,系统会自动将其纳入解析列表。另外,若地址池整体出现问题,系统将自动触发默认地址池与备用地址池之间的切换机制。
(4)访问策略配置
根据用户请求的来源,我们需确定用户最终访问哪个地址池。如图2所示,若海外用户需访问地址池,需配置相应的访问策略。设置请求来源为海外地区,默认地址池为空,而备用地址池则设定为CN-。在此情况下,若海外用户访问中心服务器,一旦发生故障,系统将迅速切换至CN-中心。
(5)CNAME接入配置
要将用户访问的顶级域名进行CNAME设置,指向全局流量管理的指定域名,如此一来,方能确保对应用服务实施容灾和智能接入功能。具体操作是将图示中的CNAME记录指向我方提供的接入域名。
配置完毕后,GTM会实时监测地址池中的地址状况。一旦检测到地址报警,便会依照图3所示的流程进行判断,并执行容灾切换。以图2中IP地址A的报警情况为例,可以观察到:若默认地址池中的地址可用,则会从解析列表中移除地址A;而若默认地址池完全不可用,则会切换至备用地址池(CN-)。这一切换过程将自动完成,并且将所需时间缩短至分钟级别。从而有效保证异地容灾的切换效率。

图3: 故障流程切换
扫一扫在手机端查看
-
Tags : _容灾切换必备--全局流量管理介绍
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。


客服1