1、TDD LTE 主 要 KPI 优 化 指 导 书适用对象:TD LTE 网优工程师摘要章节 描述1 概述 概述2 主要 KPI 指标介绍 主要 KPI 指标介绍3 KPI 指标监控流程 KPI 指标监控流程4 KPI 性能分析方法 KPI 性能分析方法5 KPI 优化分析专题 KPI 优化分析专题6 结束语 结束语7 附录 附录目 录1 概述 .12 主要 KPI 指标介绍 .22.1 指标的分类 .22.1.1 按照网元对象分 .22.1.2 按照统计时间粒度分 .22.1.3 按照指标相关性分 .22.2 接入类指标 .32.2.1 RRC 连接建立成功率 .32.2.2 ERAB 建立
2、成功率 .42.3 保持性指标 .52.3.1 无线掉线率 .52.3.2 ERAB 掉线率(小区级) .62.4 移动性指标 .72.4.1 切换成功率 .73 KPI 指标监控流程 .83.1 KPI 监控流程介绍 .83.2 日常 KPI 监控流程 .93.3 参数修改过程中 KPI 监控流程 .103.4 ENODEB 版本升级过程中的 KPI 监控 .113.5 割接过程中的 KPI 监控 .124 KPI 性能分析方法 .124.1 KPI 性能分析方法 .124.1.1 TOP N 最坏小区分析法 .124.2 KPI 性能分析基本技能 .144.2.1 KPI 监控常用工具 .
3、154.2.2 KPI 分析用到的工具 .154.3 KPI 优化分析过程 .165 KPI 优化分析专题 .195.1 RRC 建立成功率优化专题 .195.1.1 RRC 建立成功率的定义 .195.1.2 RRC 建立失败常见原因 .205.1.3 优化措施 .215.2 切换成功率优化专题 .235.2.1 切换成功率的定义 .235.2.2 切换失败常见原因 .245.2.3 优化措施 .265.3 KPI 常见原因处理手段 .276 结束语 .277 附录 .287.1 缩略语 .287.2 参考资料 .30图 目 录图 1-1 KPI 联合问题定位 .1图 3-1 日常 KPI
4、监控流程图 .9图 3-2 参数修改后 KPI 监控流程图 .10图 3-3 ENodeB 版本升级 KPI 监控流程图 .11图 4-1 KPI 优化分析流程图 .18图 5-1 RRC 接入流程 .19图 5-2 TA 接入统计分布 .21图 5-3 优化后 RRC 建立成功率 .22图 5-4 优化后无线掉线率 .22图 5-5 S1 切换流程 .23图 5-6 EUTRAN 邻接关系 .24图 5-7 同频同 PCI 配置 .25图 5-8 邻区错配 .25图 5-9 优化后切换成功率 .26表 目 录表 2-1 RRC 连接建立成功率与质量等级 .4表 2-2 小区 ERAB 建立成
5、功率与质量等级 .5表 2-3 业务掉话率与质量等级 .6表 2-4 分组域业务掉线率与质量等级 .7表 2-5 业务切换成功率与质量等级 .8表 4-1 TOP N 最坏小区列表 .13表 5-1 掉话常见原因 .2011 概 述无线网络 KPI 是体现网络质量的直接体现, KPI 监控也是我们发现问题的重要手段;KPI 监控与优化主要集中在运维期间,网络问题不能靠用户投诉来解决,对一些异常的事件必须第一时间发现并提出相应解决方案,这样才能保证为用户提供良好的话音与数据业务。在网络建设初期主要是工程优化,由于用户少,工程质量等问题,在这个阶段的 KPI优化没有太大的意义,关注点主要在 RF
6、调整上面,只要特别关注一下 RRC 、ERAB 接入成功率、ERAB 掉话率、RSSI 指标即可;网络进入运维时期后,才是真正的 KPI 优化,也即是我们通常说的参数优化,通过各种参数的联合调整来降低某项指标,达到客户的要求。KPI 数据来源于操作维护中心(OMC )的网管系统(NetNumen U31),对关键性能指标 KPI 数据进行分析,可得到各种指标的一个当前状态,这些指标的当前状态是评估网络性能的重要参考。当前我们关注的指标主要有网络保持性能、接入性能、移动性能、系统容量等;根据上述指标的当前值,判断并定位问题发生的区域、问题发生的范围、问题的严重程度;比如:某站点拥塞、某站点掉话率
7、为 10%、最坏小区比例、超忙小区比例、接入成功率、呼叫时延、切换成功率、重建立成功率等。关于 KPI 的分类,我们按照统计的来源将 KPI 分为业务 KPI 与网络 KPI;业务 KPI 是指通过外场路测测得的 KP 数据,;网络 KPI 是指通过后台综合网管统计得到 KPI 数据;本文主要讨论的是网络 KPI,通过网络 KPI 来发现网络问题。一般解决问题是通过后台 KPI 数据、告警数据、用户投诉、DT 测试联合起来进行分析定位,最终给出解决方案。图 1-1 KPI 联合问题定位OMC数 据告 警 数 据用 户 投 诉 数 据 联 合 分 析DT/CQT测 试 优 化 方 案数 据告 警
8、 数 据用 户 投 诉 数 据 联 合 分 析测 试 优 化 方 案22 主 要 KPI 指 标 介 绍KPI 指标是通过 ENB 计数器的实现,通过后台网管定制统计出来的,能真实反映网络某项性能的情况,及时发现问题,使网络的风险降低。按照时间统计粒度分为:15 分钟粒度、60 分钟粒度、24 小时粒度、周粒度、月粒度;按照统计对象分为小区级、ENB 级。2.1 指 标 的 分 类2.1.1 按照网元对象分 小区级指标 小区对级指标 天线 PORT 级指标 ENodeB 级指标2.1.2 按照统计时间粒度分 15 分钟粒度 30 分钟粒度 1 小时粒度 24 小时粒度 7 天粒度 月粒度2.1
9、.3 按照指标相关性分 保持性指标主要是包括 ERAB 掉话率,RRC 掉话率、切换时掉话; 接入类指标包括 RRC 连接建立成功率、ERAB 指派成功率、无线接通率等等。 移动性指标主要包括频内切换成功率、频间切换成功率、异系统硬切换成功率(LTE-2G、3G 切换成功率)等等。 资源类指标3主要包括下行控制信道受限、CPU 受限、业务信道受限、能承载的用户数、传输受限等等。 系统容量类指标主要包括小区级、PS 吞吐量等等。由于篇幅的限制,这里就每个类别里面的每个指标不一一叙述,可以参考随机文档性能指标参考.pdf,每个 KPI 指标实现的公式、相应计数器的定义、每个指标的分类、指标的取值范
10、围等都可以在这里找到;对于单个的计数器定义与说明可以参考随机文档性能计数器参考.pdf,该文档主要阐述各计数器的定义及触发点;本章主要对一些常用的重点指标进行举例说明,同时也以表格的形式对每个指标进行了质量等级的划分,当指标质量等级为差时,就需要对该指标进行优化了,其余的指标用类似的方法可以自己来深入学习。本文以中移 4G 一期为背景,介绍当前外场较关心的接入,掉线,切换三大指标的定义和优化措施。所有指标定义以TD-LTE 中移集团 30 个网管指标 V1.0-502 版本为基础。每个 Counter 取值采样点和 Counter 所代表的原因在 性能计数器参考.pdf都有清晰的描述,在此不再
11、一一介绍。2.2 接 入 类 指 标2.2.1 RRC 连接建立成功率本指标反映 eNodeB 或者小区的 UE 接纳能力,RRC 连接建立成功意味着 UE 与网络建立了信令连接。RRC 连接建立,包括(如位置更新、系统间小区重选、注册等)的RRC 连接建立。公式中分子和分母涉及的计数器都是 RRC Connection Request 消息中信元Establishment cause 中的所有原因。分子是 RRC 连接建立成功次数,分母是 RRC连接建立尝试次数。对外公式都采用成功+失败来表示请求,实际上也要参考或核对请求计数器。2.2.1.1 公式定义:RRC 连接建立成功率=RRC 连接
12、建立成功次数/ RRC 连接建立请求次数 *100%42.2.1.2 RRC 建立连接成功率集 团 规 范 (V1.1.0) 集 团 规 范 (V1.1.0) 600 版 本 公 式 对 应 600版 本 PIRRC.AttConnEstab C373200084+C373200085+C373200086+C373200087+C373200088+C373200124 311129RRC.SuccConnEstab C373200000+C373200004+C373200008+C373200012+C373200016+C373200120 311130RRC.SuccConnEsta
13、b/RRC.AttConnEstab*100%2.2.1.3 KPI 指标取值与质量等级表 2-1 RRC 连接建立成功率与质量等级序号 统计对象 统计粒度 取值范围 质量等级1 CLUSTER/Cell 级 24 小时 小于 80% 差2 CLUSTER/Cell 级 24 小时 80%-98% 良3 CLUSTER/Cell 级 24 小时 大于 98% 优2.2.2 ERAB 建立成功率本指标用于了解该小区内 UE 业务建立成功的概率,部分反映了该小区范围内用户发起的业务的感受度。比较准确的做法 :分子是 ERAB 建立成功次数,分母是 ERAB建立尝试次数。E-RAB 建立成功则是成功
14、为用户分配了用户平面的连接。2.2.2.1 公式定义:ERAB 建立成功率=E-RAB 建立成功数/E-RAB 建立请求数 *100%2.2.2.2 E-RAB 建立成功率集 团 规 范 (V1.1.0) 集 团 规 范 (V1.1.0) 600 版 本 公 式 对 应 600版 本 PIERAB.NbrAttEstab C373505472+C373505480 311128ERAB.NbrSuccEstab C373505473+C373505481 311149ERAB.NbrSuccEstab/ERAB.NbrAttEstab*100%52.2.2.3 KPI 指标取值与质量等级表 2
15、-2 小区 ERAB 建立成功率与质量等级序号 统计对象 统计粒度 取值范围 质量等级1 CLUSTER/Cell 级 24 小时 小于 80% 差2 CLUSTER/Cell 级 24 小时 80%-98% 良3 CLUSTER/Cell 级 24 小时 大于 98% 优2.3 保 持 性 指 标2.3.1 无线掉线率无线掉线率反映了系统的业务通讯保持能力,也反映了系统的稳定性和可靠性。UE掉话是指由于异常原因被 UE 主动发起 RRC 释放的情况;公式统计的是异常原因的掉话率,现在归为正常释放的原因值包括:用户不活动(inactive)、操作维护干预、过载控制导致的释放、CCO 、重定向,
16、其他情况归为异常。2.3.1.1 公式定义:无线掉线率=(eNB 请求释放上下文数-正常的 eNB 请求释放上下文数) /初始上下文建立成功次数*100%2.3.1.2 无线掉线率集 团 规 范 (V1.1.0) 集 团 规 范 (V1.1.0) 600 版 本 公 式 对 应 600版 本 PICONTEXT.AttRelEnb C373220612+C373220613+C373220614+C373220615+C373220616+C373220618+C373220620+C373220621+C373220622+C373220635 311178CONTEXT.AttRelEnb.Normal C373220615+C373220618+C373220635 311439CONTEXT.SuccInitalSetup C373220600CONTEXT.NbrLeft C373220656(CONTEXT.AttRelEnb-CONTEXT.AttRelEnb.Normal)/ (CONTEXT.SuccInitalSetup+CONTEXT.NbrLeft)*100%