LTE核心网常见故障和投诉案例分析
时间:2015-06-20 来源:网络 作者:秩名 点击:
次
主页(http://www.pttcn.net):LTE核心网常见故障和投诉案例分析
案例一:临时方案用户预换卡不能使用2、3G业务
【故障现象】
临时方案的用户,在更换USIM卡但未开通4G业务的情况下,在4G网络的覆盖下,用4G手机终端可能无法正常使用2,3G业务。只能在4G手机上设置“2,3G only”,才能恢复正常使用。
【故障分析】
临时方案的用户,在更换USIM卡但未开通4G业务的情况下,当前BOSS系统只是将用户的IMSI鉴权信息通过BOSS指令存储到HSS,并未建立IMSI和MSISDN的关联,即未放号为签约用户的任何2、3G的分组域、电路域和4G业务的签约信息。这种场景下HSS给MME返回DIAMETER_ERROR_USER_UNKNOWN的错误码,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN码后,给终端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值。终端收到“EPS services and non-EPS services not allowed”的NAS值后,不再尝试重新选网。
【故障解决】
针对这种临时方案的用户,如果只更换USIM卡不签约4G业务,根据测试,MME给终端返回#7 “EPS services not allowed”的NAS值能够使终端较快地重选到2、3G网络。根据协议中定义的映射规则,HSS需要给MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的错误原因值,对应到HSS上,需要BOSS在用户进行更换USIM卡时,不管用户签不签约4G业务时,都要向HSS发送放号的BOSS指令,如果用户不签约4G业务,则通过设置4G-APN模板为0来关闭用户的4G功能。
启示:网络侧把问题归类后,通过NAS值反馈给终端,终端针对不同的NAS值会有不同的响应行为,在定位此类问题的时候,需要抓取信令,观察S1-MME接口上附着失败或者TAU失败的原因值。
案例二:国际漫游用户漫入到国内MME下无法使用
【故障现象】
韩国、香港等国际漫游用户在国内某市中兴MME下无法附着使用4G业务,而国内用户在同一地点正常使用4G业务。
【故障分析】
进行信令跟踪,发现国际漫游用户附着时,MME回了PDN connectivity reject,原因值为网络失败:
MME失败观察报TAC的DNS解析失败:
MME上检查对TAC的域名解析缓存,发现只有x-s5-gtp服务,而国际漫游用户需要使用x-s8-gtp服务:
【故障解决】
在DNS上修改TAC域名解析数据,增加对X-S8-GTP的解析结果。增加完毕后,再次检查MME上收到的DNS返回结果,发现支持X-X8-GTP,再次测试,国际漫游用户使用4G业务正常。
案例三:过渡方案4G用户终端有4G信号但附着失败,驻留2,3G
【故障现象】
过渡方案4G用户终端有4G信号,但是附着失败,只能驻留在2、3G网络,更换位置后重新有4G标志,尝试附着仍然失败。
【故障分析】
进行信令跟踪,发现用户在2、3G下无附着4G的请求上来,要求4G用户更换位置,能触发附着请求,查看信令发现拒绝原因值是#15 No Suitable Cells In tracking area,同时在中兴MME上抓包发现HSS返回的鉴权有错误,错误码是DIAMETER_AUTHORIZATION_REJECTED,检查HLR该用户签约数据,发现有2,3G签约,但4G被关闭(OBEPC-1),因此爱立信HSS返回DIAMETER_AUTHORIZATION_REJECTED,根据规范,MME会回复#15:No Suitable Cells In tracking area,导致终端不断重复4G附着,最后因失败该TA被终端记录下来作为不被允许的TA,不再尝试附着,但是更换了位置后,不同的TA下可以重新附着4G网络,但是因为HLR中停止了4G功能,附着4G网络仍然失败。
【故障解决】
查看NAS值规范,针对4G被停机的情况,建议爱立信HSS返回UNKNOWN_EPS_SUBSCRIPTION,这样MME回复#7 EPS not allowed,只影响4G业务,不影响2,3G。
案例四:爱立信MME到中兴MME切换出现4G业务断流
【故障现象】
在测试4G用户从中兴MME覆盖下切换到爱立信MME覆盖范围,发现4G用户切换失败,出现4G业务中断的情况。
【故障分析】
经过在MME侧抓包分析,从爱立信MME覆盖范围移动到中兴MME覆盖范围内,会由原MME发起Forward Relocation Request,并NAS层加密算法选定EEA2。
.... 0010 = Used NAS Cipher: 128-EEA2 (0x02)
但是在其后对中兴MME发起的TAU中,中兴MME发起了到HSS的鉴权请求,并选定
000 .... = Type of ciphering algorithm: EPS encryption algorithm 128-EEA0 (ciphering not used) (0x00)
EEA0作为加密算法,并向基站发起UE CONTEXT MODIFICATION REQEUST,要求基站修改NAS层加密算法,但是被基站拒绝。究其原因,是因为爱立信基站不支持TAU过程中的UE上下文修改。
【故障解决】
通过爱立信MME的加密算法优先级,选定EEA0作为最高优先级,使得切换过程无需修改UE上下文,规避此问题,但是最终需要爱立信基站增强该部分功能。
案例五:某市CSFB呼叫失败原因
【故障现象】
某市5s用户可以上4G进行数据业务,但是进行CSFB呼叫失败。
【故障分析】
经过MME以及MSC的联合调测发现,该用户在联合附着中,PS域附着成功,但CS域附着失败,初步怀疑是TA-LA映射表的MSC指向错误,核查该MSC pool中开了SGS口的MSC正确。最后在SGS口抓取信令,发现原因是MME通过SGS口发向MSC的Location update的过程中,MSC拒绝了,因为MME上配置的mme id和MSC上配置的mme id不一样 ,因此MSC拒绝了CS域的附着请求。
【故障解决】
究其原因,是因为爱立信设备的一个限制,在MME上未能按照mmegi的规划,因此造成这个差别。在MSC上将mme id改为与MME上配置一致后,用户拨测CSFB呼叫正常,短信发送接收正常,问题解决。
案例六:某市公司5s用户开启无法附着到4G
【故障现象】
某市用IPHONE 5S在关闭4G功能的情况下附着在3G网络,正常发起业务,但是打开4G开关,出现20多秒无服务,最后附着在3G,只能通过重启终端附着上4G。
【故障分析】
5s关闭4G网络,PDP激活到GGSN(5s关闭4G网络后,终端不上报4G能力,SGSN的UE能力识别为非4G终端,引导选用到GGSN。当5s开启4G网络,会发起combined TAU到MME,此时返回TAU reject,原因值为CC=17 (network failure);原因是MME上有PGW 选择的校验,发现SGSN回复的SGS CONTEXT RESPONSE消息中携带了GGSN的地址,包含在Private Extension部分。终端收到#17的网络故障原因值后,会重复以上TAU过程5次,都被拒绝,所以就出现了 十几秒后重选回3G网络的现象。只有重启手机,才能正常返回4G。
究其原因,苹果5s的关闭4G功能,不上报终端4G能力,导致网络侧没有正常引导业务到PGW上,导致互操作失败。
【故障解决】
通过关闭SGSN的Private Extension消息体的回复,规避MME的PGW校验,使得TAU流程能在MME继续进行,最后因为创建承载失败而TAU拒绝,此时返回的NAS原因值不再是#17,因此苹果5s可以重新发起一次附着,从而返回4G网络。
案例七:排除用户原因的附着成功率低
【故障现象】
某天某省的排除用户原因的附着成功率从90%以上,下降到60%左右。
【故障分析】
从该指标的算法看,排除用户原因的附着成功率= EPS附着成功次数 / (EPS附着请求次数 -非法用户的EPS附着失败次数 -非法ME的EPS附着失败次数 -EPS服务不允许的EPS附着失败次数 -EPS和非EPS服务不允许的EPS附着失败次数),也就是附着请求次数 - #3 - #6 - #7 - #8的错误请求(减去属于用户原因部分),但是通过厂家网管查看15分钟颗粒度性能指标发现,在某个时刻开始,#15的错误请求次数增加明显,询问发现市场部推行用户开户模板默认关闭4G功能,导致全省大量用户出现4G停机现象, 2、3G正常的情况下,HSS返回DIAMETER_AUTHORIZATION_REJECTED (5003),MME将其映射的NAS原因值为#15:No Suitable Cells In tracking area;从而影响了排除用户原因的附着成功率。
【故障解决】
可知,上述原因是用户停机原因导致,因此对于NAS值#15的返回值,实际上包含部分用户原因的问题在里面,目前的确存在这样的情况。只能通过厂家MME上的NAS值映射功能,把这种HSS错误映射到其他原因值,从而在不影响用户感知的情况下,保证指标的客观准确性。
案例八:无4G信号投诉的解决
目前最常见的投诉是用户反馈4G无信号或不能使用4G业务。
首先确认故障的范围,是个别用户问题、还是号段用户都有问题、还是一大片区域都存着此故障。
个别用户问题的尝试解决办法:
1)可以先在HSS上查询该用户的签约数据是否正常。
2)通过MME/SGW/PGW/HSS信令跟踪来确定具体原因。如果MME上跟踪不到任何S1口信令,一般是由于终端或USIM卡原因造出。如果MME上跟踪到了用户信令,需要查看各接口的信令来确定具体原因,比如有可能是用户鉴权流程中失败、用户使用了非法的APN等。TIPS:信令跟踪时建议通过IMSI来跟踪用户以便跟踪较全的信令。
3)如果不方便进行用户信令跟踪,可在HSS/MME上查看用户信息来进行简单判断。
如果能查到MME信息,说明至少用户曾经在4G网络成功附着过,现在不能使用的原因有待进一步分析,如果没有MME位置信息,说明用户可能从未在4G网络附着过。
(中国集群通信网 | 责任编辑:陈晓亮) |