1、重要活动应急 通信 保障方案 一 、 应急保障分类 恰当的应急分类是指导应急方案制定和实施的重要一环, 明确应急保障分类,是分析应急保障事件特征的重要工具,进而明确保障的重点和难点,明确制约应急保障的主因和次因,并制定针对性的保障方案。 一般应急保障分为常规性通信保障、突发事件通信保障、重大事件通信保障。 二、 重大事件 应急保障流程 针对重大事件应急保障,一般分事前、事中、事后保障三个阶段。 通信应急保障分类 常规性通信保障 突发事件通信保障 重大事件 (活动) 通信保障 针对通信网络建设中和日常优化运营中的各种风险,如设备故障、网元负荷、传输、动力等 通 信事故、突发政治事件、公共安全事件
2、、自然灾害事件等 重要通信保障任务(重大活动、国事会议、大型体育运动会等)、军事演习等重要通信保障活动 三、 应 急保障举例 东荷体育馆许巍演唱会应急保障方案 1、 信息采集( 保障 时间 、地点 及 范围 ) 据演唱会官方发布,许巍将于 11 月 29 日于东荷体育馆举行巡回演唱会,为 满足 界时 大量突发 通信 需求,济南移动提前进行通信测试保障, 具体 测试 安排如下: 1)活动 时间 : 2014 年 11 月 25 日 至 29 日 2)测试设备: MIFI 终端及 D2 测试手机 3)测试范围 : 应急保障 事前 事中 事后 020406080100第一季度 第三季度东部西部北部信
3、息采集 关键时间点控制 责任分工,落实实施 保障 方案确定 、应急预案制定 现场测试保障、现场动态反馈 应急处理流程待命 应急数据删除、网格恢复 保障人员落实 机房数据告警监控,定时发送 现场故障处理、实时参数调整 总结经验 、 输出总结报告 保障 期间 数据提取及分析 活动范围为济南东荷体育馆,重点保障区域为 1-4 层看台及走廊人员聚集区域及三楼包厢区域。 2、 演唱会 测试 保障 方案 测试前 注意事项 : 1) 确认 测试 区域 : 活动进行前提前模清体育馆现场建筑 结构,各 RRU 布放位置及覆盖范围, 确保各 RRU 运行正常。 2) 测试 人员 提前到位: 由于早忙时堵车严重,要
4、求测试 人员提前进入场馆进行通信保障。 3) 风险 点规避 : 活动期间 设备故障及大话务带来的拥塞等指标恶化,需要提前协调应急通信车及工程设备 RRU 备件, 避免打不通电话引起的大量投诉。 4) 测试范围 站点状态监控 : 后台人员测试前提前到位,提取现网各站点运行、告警及话务量状态, 如发现问题及时报保障人员 , 及时进行有效规避处理。 5) 关键配置 检查 -修改 TDD SRS 配置方式 为接入 优先。 -打开 SRI 资源自动调整开关 。 -关闭 DRX 开关 。 -扩双载波 并 配置负载均衡。 -保证 周围邻区关系 完整。 活动 保障 方案实施 施 1) 提前进行话务分析,预估话
5、务需求 。分析活动现场占用小区情况,针对活动现场人员情况对相应小区进行扩容处理,提前协调应急通信车到现场进行保障 2) 对重点人物入场路线及重点场所进行模底保障。 对活动周边道路进行遍历测试及重点区域的 CQT 拨测,确保目标人物的通信体验。 3) 加强设备监控力度 .加大话统分析和告警监控力度,对每日指标性能最差小区进行分析,拿出解决方案,及时解决。 每小区发出告警及话务 监控信息,抄送全体保障组人员, 准备相关应急板件,保障基站稳定运行 , 预留部份重要的备品备件以便能及时处理重要基站的故障 4) 应对突发事件通信保障 突发事件的一个突出现象就是某个特定区域内短时间话务激增,出现高拥塞现象
6、,为很好的应对此类事件,我们从以下 5 个方面做好应急保障工作: A、 应急小区预安装 : 应急小区数据、 装传输电路及基站数据预先制作并调试完成,根据活动需要随时可以开启应急。 B、 专项应急设备:仓库常年备存 BBURRU 等相关设备, 同时有配套的天馈系统和其它配套设施,作为应急通信的专项备品备件。 C、 专项 车辆配备:网优中心配有应急通信车辆 1 台,承担应对突发事件的开站、扩容、测试和故障处理工作。 D、 专项人员配备:各个专业有专门处理突发事件的应急人员 3、 应急 预案 一般情况下,通过活动前巡检,不会出现如上告警。但是一旦出现如上告警,轻则影响性能,重则业务中断。请按照如下原
7、则进行处理: 1) 首先按照告警帮助进行处理(重启和换板措施在本步骤先不考虑); 2) 若不能消除告警,尝试重启; 3) 若仍然不能解决问题,尝试更换单板。(需要提前准备好备板) RRC 建立成功率急剧恶化应急处理 【入口条件】 通过实时监控或 15分钟话统发现 RRC建立成功率已经急剧恶化(恶化程度已经超过客户预期),且 通过 15分钟话统看到 L.RRC.ConnReq.Max指标 100,且 通过 15分钟粒度话统看到 CPU峰值超过预设门限的次数( VS.Board.CPULoad.CumulativeHighloadCount)超过 5%。假如话统周期是 15分钟,那么每个话统周期共
8、检测 15*60=900次。如果这个 counter值超过 45,就认为满足过载条件。 【应急措施】 应急方案 启动 AC BAR,降低导频功率,缩少覆盖范围。 参数回退 上述方案影响用户体验,尤其是 AC BAR。因此当从 15 分钟话统中看到 CPU 最大占有率低于 70%后,需要将上述措施依次回退。每回退一个,观察 15 分钟。 CELLACBAR时间因子回退到 70; 取消 CELLACBAR; UE不活动定时器恢复为初始值; 回退过程中如果又出现 CPU 过载,则取消上一步回退。 4、 测试 保障团队 人员 职责 济南 LTE 网络 ATU 测试保 障团队人员职责 分组 人员 职责
9、李长安(华为) 华为服务经理;协调人员、资源 王献永(华为) 华为网优负责人;对各模块之间的沟通, 测试华为保障人员进行工作协调安排、 测试全程保障 测试维护保障组 王根 (华为) 前场电话联系, 现场问题处理协调 赵鹏 (华为) 话务、 告警 、干扰 监控 /15 分钟,告警站点、不可用小区 及时告知,协调 处理 杨永亮 (华为) 现场测试保障工作,对现场各区域测试并反馈测试情况,结合 现场情况提出合理处理建议 崔亮 (华为) 现场测试保障工作,对现场各区域测试并反馈测试情 况,结合现场情况提出合理处理建议 5、 测试问题分析及总结 1、 测试结束 后,提取当天的测试指标,将测试情况通报项目组 ; 2、 测试结束后,对数据进行 分析, 并对问题点进行优化处理, 输出测试报告 ; 3、 测试结束后,总结测试期间的保障经验,输出总结报告及下阶段保障方案 。 附件: 东荷体育馆 RRU 位置及 建筑结构图 体育馆 RRU 分布 东荷体育馆 1 层平面图: 东荷体育馆 2 层平面图: 东荷体育馆 4 层平面图: