移动通信网络的容灾技术
来源:通信世界网 更新时间:2008-06-26


作 者:刘竞翔 丁燕菁 刘峰
    摘要:随着移动通信网络的普及,

用户对移动通信的服务质量要求越来越高;运营商也要求网络节点发生故障后,网络能够继续提供服务。为实现这一要求,双点甚至多点备份被逐步应用到网络中,双归属技术和IuFlex技术是其中比较成功的两种容灾方式。双归属技术是典型的双点备份,备机在主机故障后接替主机。IuFlex技术则属于多点备份,在单一交换节点故障后,其工作被交换池内其他节点接替。

    关键词:移动通信网络;容灾技术;双归属;IuFlex

    Abstract:Withthegrowingpopularization of mobile communication services, a growing demand for better Quality of Service (QoS) arises from the subscribers. An uninterrupted service provided with the network after a node failure is also expected from operators. To achieve this, duplex backup and even multiplex backup have been gradually introduced into the network. Among redundancy techniques, dual-home and IuFlex are more successful. Dual-home is a typical duplex backup system with activation of the backup server after the host server failure. IuFlex is one of the multi-backup techniques with overhead transference to other node in switching pool after single switching node failure.

    Keywords:mobilecommunicationnetwork; redundancy technology; dual-home; IuFlex

    网络安全是移动通信服务质量的关键因素之一,为了提高运营水平,移动运营商必须给用户提供高品质、不间断的服务。而由于人为操作失误、设备故障、自然灾害等原因,通信网络节点的故障往往不可避免。其中交换设备由于在网络中所处的位置较高,其故障带来的损害往往影响较大,且故障恢复的时间也较长。为提高网络安全,各厂商提出多种容灾技术,现有比较成熟的技术有双归属技术和IuFlex技术,下文将对此两种技术进行介绍和比较。

    1  双归属技术

    双归属技术是为网络中运行的交换设备提供备份节点的网络容灾方法。我们称日常运行的设备为主用节点,为主用节点提供业务备份功能的节点是备份节点。主用节点故障后,备份节点检测到故障发生,接替主用节点提供服务。从网络结构来看,双归属可以分为1+1主备、1+1互备、N +1主备、N +1互备。

    1.1组网模式

    (1)1+1主备

    1+1主备的结构如图1所示,其中服务器1(Server1)是主用节点,服务器2(Server2)是备用节点,备用节点和主用节点采用相同的容量配置。服务器(Server)和媒体网关(MG)之间的接口为媒体控制接口(Mc) [1]。正常工作情况下,媒体网关1(MG1)注册在Server1下,Server1作为主用节点为网络提供服务。故障发生后,Server2激活,MG1转而注册到Server2,Server2接替Server1提供服务。

 

    (2)1+1互备

    1+1互备的结构如图2所示,其中Server1和Server2都有自己的业务处理,MG1和媒体网关2(MG2)注册在Server1,媒体网关3(MG3)注册在Server2。MG之间的接口为Nb接口。正常工作时,Server1和Server2处理自身的业务。其中一个节点故障后,另一节点则接替故障节点的业务。 比如Server2故障,Server1将会接替Server2,Server2下的MG3会注册到Server1上。

 

    (3)N +1主备

    N +1主备中有N 个主用节点和一个备份节点,备份节点为这N个主用节点提供冗余备份。正常情况下,N个主用节点处于工作状态,当其中一个节点故障后,备份节点激活接替该节点的业务。

    图3是N +1主备的示意图,其中N =2,Server1和Server2是主用节点,Server3是备份节点,MG1注册在Server1,MG2注册在Server2。

 

    (4)N +1互备

    与N +1主备比较,N +1互备的备份节点除了为主用节点提供备份外,同时有自己的业务处理。

    图4是N +1互备的示意图,其中N =2,Server1和Server2是主用节点,Server3是备份节点,MG1注册在Server1,MG2注册在Server2,由于Server3本身要处理业务,有MG3注册在Server3。Server3本身的业务不受其他网元备份。

 

    1.2业务流程

    (1)故障检测

    为了让备份节点能够检测主用节点的故障,备份节点和主用节点之间有心跳线连接。该心跳线可以是基于IP的,也可以基于时分复用(TDM)。考虑到组网的便利性,推荐采用基于IP的心跳线。

    当采用基于IP的心跳线时,主备Server间可以通过用户数据报协议(UDP)、传输控制协议(TCP)或流控制传输协议(SCTP)来承载心跳信号。这需要在两端各配置一个IP地址,另外还有用于心跳线的UDP/TCP/SCTP的IP端口号。

心跳线建立好后,主备节点可以通过心跳线不断地向对方发送心跳消息,并等待对端的回应。如果没有回应,则失败次数加1;如果失败次数达到一定域值,则认为对端故障。

    为了防止心跳线临时故障所造成的错误倒换,在故障检测中还加入MG注册判决机制。心跳中断后,备份节点检测是否有原主用节点下的MG来注册。如果注册的MG数量超过一定门限,则认为主用节点确实发生故障,备份节点激活并接管主用业务。

    (2)网关重新注册

    根据H.248协议,MG具有向多个Server注册的能力,其中主用Server的优先级高,备用Sever的优先级低。故障发生前,MG向可用优先级高的主用Server发送SeviceChange消息请求,进行注册。如果收到注册成功的命令,则完成了注册,将主用Server设置为控制Server,随后MG就受此主用Server控制[2]。

    当主用Server故障后,由于到主用Server的信令链路中断,MG认为此Server不可用,于是按照启动后的注册流程注册备份Server。

    (3)信令备份

    现在移动通信网络上主要采用报文传输部分(MTP)和IP两种信令方式,对这两种方式,我们采用不同的备份方法。

    对于采用MTP承载的信令,主要有移动应用部分(MAP)、CAMEL应用部分(CAP)、ISDN用户部分(ISUP)、电话用户部分(TUP)、A接口,备份方法有两种[3]:

    信令链路级备份

    主备Server配置一个公共信令点,各邻接局认为主备Server是一个局向,同时配置到主备Server的MTP链路,分别占用不同的信令链路编码(SLC)。到主用节点的SLC一般是0~7,到备用节点的SLC一般是8~15。

    正常工作时,主用节点链路是激活的,备用节点链路是闭塞的,于是MTP3采用主用节点链路传送信令。当主用Server故障时,主用节点链路闭塞,备份Server激活备用节点链路,于是MTP3采用备用节点链路来传送信令。

    路由级备份

    主用Server配置一个信令点A,备份Server配置信令点A和信令点B。各邻接局认为主用、备份Server是两个局向,信令点分别为A和B。主用Server配置两个信令路由,分别是到A的直连主用路由和经过B点到A的备份路由。

    正常工作时,MTP3采用主用路由传送信令,在主用节点故障后,MTP3转为使用备份路由。备份Server收到目标点码为A的MTP3信令后,替代主用Server在本地进行处理。

    在IP承载上主要采用MTP3用户适配(M3UA)信令,M3UA的倒换一般采用偶联分担方式。主用、备份Server配置同一个信令点A[4],对于邻接网元来说,可以将信令点A配置为一个应用服务器(AS)。AS包含的偶联分为两组,一组是到主用Server,一组是到备用Server,两组偶联数量和带宽配置完全相同。正常情况下,只有到主用Server的偶联激活,到备份Server的偶联是闭塞的,于是到本AS的信令被传送给主用Server。当主用Server故障时,备份Server激活偶联,于是本AS的信令被传送给备份Server。

    (4)业务备份

    备份Server接替主用Server提供服务,因此备份Server应该有与主用Server一致的业务特性。为保障这一点,主用、备份Server之间需要支持业务配置数据同步。用户在主用Server的操作维护平台(O&M)修改配置数据后,数据通过主备Server O&M间的IP网络连接,同步到备份Server O&M。

    2  IuFlex技术

    IuFlex功能在3GPP R5引入,它允许一个无线接入网络(RAN)节点到多个核心网(CN)节点的域内连接路由功能。用户发起业务后,RAN节点把消息路由到不同的CN节点进行业务处理。其中,这些RAN节点和CN节点组成一个池域(Pool)。

    2.1组网模式

    图5[5]是一个典型的Pool配置。图中为简略起见,没有标出核心网中的媒体网关。

    2.2业务流程

    (1)NNSF功能

    非接入节点选择功能(NNSF)是无线接入网络(RAN)节点从终端永久识别码(IMSI)或者终端临时识别码(TMSI)选择核心网络(CN)节点的功能,使用户进入Pool后始终接入同一个CN节点,避免用户位置的变更引起Pool内CN节点间的位置更新。

    IMSI到CN节点之间的映射关系并不是固定的,RAN节点可以根据时间和负荷调整映射方式。

    (2)NRI标识

    网络资源标示符(NRI)在Pool内唯一标识一个CN节点。在Pool以及相交的Pool内,NRI不可以重用,但是协议允许一个CN节点有多个NRI[6]。

    CN和RAN节点间通过TMSI来携带NRI信息。TMSI的长度共32bits,其中NRI的长度为0~10bits,位于TMSI的bit14到bit 23之间[7]。

    对应于NRI有NRI掩码,它包含了NRI的比特长度和NRI在TMSI中的起始位信息,从TMSI和NRI掩码可以推导出NRI。Pool内NRI掩码唯一。

    在Pool内有一种特殊的NRI被称为Null NRI,它不属于任何CN节点,用于Pool的用户迁移流程。

    (3)位置更新

    Pool内的用户,如果使用IMSI发起位置更新,RAN节点使用NNSF功能从IMSI确定对应的NRI,将信令路由到该NRI对应的Server。Server收到并处理位置更新请求,位置更新之后,Server发起TMSI重分配流程。重分配的TMSI中包含Server的NRI信息,用户的后续业务将使用该TMSI发起,并由RAN保证业务路由到同一个Server下进行处理[8]。

    Pool用户如果使用TMSI发起位置更新,RAN由TMSI和NRI掩码得到NRI,并根据NRI得到该用户注册的Server,将消息路由到该Server,之后Server进行位置更新。

    (4)主叫流程

    Pool内的用户,如果使用IMSI发起呼叫,RAN节点使用NNSF功能获取IMSI对应的NRI,将信令路由到该NRI对应的Server。Server处理呼叫请求,发起TMSI重分配流程。重分配的TMSI中包含Server的NRI信息,用户的后续业务将使用该TMSI发起。

Pool内用户如果使用TMSI发起呼叫,RAN由TMSI和NRI掩码得到NRI,并根据NRI得到该用户注册的Server,将消息路由到该Server,之后Server进行呼叫处理。

    (5)被叫流程

    Server发送的寻呼消息中带有全球核心网标识(Global-CN-ID),如果寻呼消息中只有IMSI,RAN会临时保存该IMSI和Global-CN-ID的关系。如果用户使用IMSI返回寻呼应答,RAN用Global-CN-ID找到下发寻呼的Server,并把寻呼应答发送给Server处理。

    如果Server寻呼时带TMSI,则RAN根据TMSI中的NRI来识别所连接的MSC[9]。

    (6)容灾处理

    当Pool 中某Server发生故障,RAN识别该Server不可达,会将本来分配给该Server的新发起的用户业务转移到Pool中其他有效Server,从而实现Pool内Server节点的容灾。

    对于故障Server下注册的用户发起位置更新请求,新Server处理位置更新,并发起TMSI重分配流程。重分配的TMSI中包含新Server的NRI信息,用户的后续业务将使用该TMSI发起。

    当故障Server下注册的用户发起主叫业务的时候,RAN将呼叫分配到Pool中其他有效Server处理,该Server因为TMSI非本局分配,以用户未知为理由拒绝呼叫。用户会重新以IMSI发起位置更新,从而通过NNSF过程,注册到新Server下。

    (7)用户迁移

    IuFlex网络的另一种容灾方法是用户迁移,即在Server开始维护前,通过用户迁移过程将该Server下的用户转移到其他正常工作的Server下,并保证负荷平均。在Server维护结束后,同样可以通过用户迁移,将部分用户重新转移到该Server下。

    用户迁移由操作维护命令(O&M)触发,其步骤如下:

    通过O&M,在RAN节点和Pool内各Server上配置维护Server的状态,设置该Server的状态为卸载状态。

    卸载状态Server下的用户发起业务,该卸载Server处理本次业务,重新分配带有NullNRI的TMSI给用户终端,同时携带位置区(LAI)为本局的非广播位置区(Non-broadcastLAI)。

    用户结束当前业务后,由于Non-broadcastLAI与用户所在RAN广播的LAI不同,用户终端立即使用前面分配的TMSI发起位置更新。

    RAN接收到位置更新消息,由于TMSI中的NRI为空NRI(NullNRI),故根据Pool内各剩余有效Server的容量选择新Server,将消息发送到该Server处理。被选择的Server处理用户终端的位置更新业务,进行TMSI重分配流程,新TMSI中带有本局NRI。在位置更新过程中,新 Server从位置更新请求的Non-broadcast LAI推导出用户原来的Server,并到原来的Server获取用户IMSI和鉴权加密信息。

    对一个Server的用户迁移时间一般较长,需要约2-3个位置更新周期。除了对一个Server内所有用户的迁移,用户迁移也可以针对部分用户进行,从而达到调节Pool内Server负荷的目的。

    用户迁移和普通容灾的区别在于,用户迁移通过O&M 命令触发,并且迁移过程中需要卸载Server的不断参与。因此,用户迁移不适用于突然灾难引起的节点宕机容灾。

    3  IuFlex和双归属技术比较

    双归属技术解决了Server节点的容灾问题,而且不需要外部网元的配合,因此更适用于跨地域大本地网组网模式。开局中,运营商按照当地的组网规划,可以适当的选取不同结构的双归属备份方案。

    IuFlex技术需要接入网络参与,物理上每个RNC的Iu接口同时连接到Pool内多个MG,网络升级和改造成本较高。但是IuFlex技术在解决容灾问题的同时,提供了网络的负荷分担和管理能力,并且降低网络信令流量。因此,对用户密集、需要建立多个局点的大城市,建议采用IuFlex技术。

    以中兴通讯在山东开局为例,当地有济宁,菏泽等7个地区需要建立局点,每个区域的用户数量从10万到20万不等,为了提高运维效率,选择在每个地区部署一个MG,同时在济南和青岛各部署一个Server,分别管理上述MG。现场的组网示意图如图6,由于两个Server下的容量都在50万用户以上,Server节点故障将造成大面积的网络瘫痪,故根据该处组网的特点,采用1+1互备双归属容灾。在济南或者青岛一处的Server故障后,另一处的Server将通过两者间的心跳线检测到故障发生,让对方的MG注册到本Server下, 从而接替故障Server提供网络服务。采用上述的双归属组网,不但提高了网络服务的安全性,同时该容灾方式也被用于软/硬件升级等系统维护过程,减少Server维护所造成的网络服务中断。

   

    4  WCN容灾性能

    WCN交换机作为ZTE移动通信的核心产品,全方位的实现了双归属和IuFlex技术,并且具备在大型网络中应用的成功经验。

    对双归属组网,WCN作为备份节点可以支持对16个主用节点提供备份功能,故障检测时间少于60s,业务恢复时间少于120s。

    对于IuFlex技术,WCN支持Pool内容纳16个交换机以分担负荷。

    5  结束语

    双归属技术和IuFlex从不同的技术角度出发,解决了移动通信网络的交换节点故障问题,提高了移动通信网络的可靠性和服务质量,正越来越为运营商所关注。

    6  参考文献

    [1]3GPPTS23.002, Network Architecture[S].

    [2]ITU-TH.248.1,Gateway Control Protocol[S].

    [3]ITU-TQ.704,Signaling Network Functions and Messages[S].

    [4]SignalingSystem7 (SS7) Message Transfer Part 3 (MTP3): User Adaptation Layer (M3UA) [R]. United States: RFC Editor, 2002.

    [5]3GPPTS23.236, Intra-domain Connection of Radio Access Network (RAN) Nodes to Multiple Core Network (CN) Nodes[S].

[6]3GPPTR21.905, 3G Vocabulary[S].

    [7]3GPPTS23.003, Numbering, Addressing and Identification[S].

    [8]3GPPTS24.008, Mobile Radio Interface Layer 3 Specification; Core Network Protocols; Stage 3 [S].

    [9]3GPPTS25.413, UTRAN Iu Interface RANAP Signaling[S].

    作者简介:

    刘竞翔,中兴通讯股份有限公司工程师。硕士毕业于北京理工大学。现从事中兴通讯移动核心网电路域产品的研发。丁燕菁,中兴通讯股份有限公司工程师。硕士毕业于东南大学。曾负责中兴通讯移动核心网ZXWN-CS产品研发工作,现从事移动核心网分组域产品研发。刘峰,中兴通讯股份有限公司工程师。硕士毕业于中国科学技术大学。现从事中兴通讯移动核心网电路域网管研发。曾发表专利:对移动通信设备中内存数据库定时监控的方法。