1、IPTV 常见故障处理手册(第一版)哈尔滨市分公司 运行维护部2012- 9IPTV 常见故障处理手册1目 录第一章 IPTV 用户端至局端组网介绍 .21.1 BAS 上联 .21.2 BAS 下联 .3第二章 故障排查方法 .32.1 用户端硬件排查 .32.2 用户端硬件设置排查 .32.3 用户账号、密码错误或用户不存在的排查 .42.4 接入层 DSLAM 或 ONU、OL T 的排查 .42.5 BAS 或 SITV-SR(在建或部分区域已用)的排查 .42.6 烽火平台和文广系统的排查 .5第三章 机顶盒启动的进度条分析 .53.1 开机进度条在 7%或 47%之前停住的为网络故
2、障 .53.2 开机进度条停留在 47%-52%-85%之间为机顶盒硬件出现硬件损坏的故障 .53.3 开机进度条停留在 85%98%为业务账号认证无法通过的故障 .63.4 开机进度条停留在 98%的故障 .6第四章 故障分类及案例 .64.1 尚未进入 EPG 首页面的故障 .74.2 成功登陆 IPTV 系统后,在收看过程中出 现的故障 .11机顶盒错误代码附表: .15IPTV 常见故障处理手册2第一章 IPTV 用户端至局端组网介绍下图给出网络连接的为多个基本拓扑的叠加叠加示意图:机顶盒PC 机多口MODEM 或家庭网关DSLAM 或 ONU OLTBASSITV-SR边缘节点(单播
3、)中心节点(组播)如图所示,数据流向以 BAS 或 SITV-SR 分界大致情况为:1.1 BAS 上联数据无论到 BAS 还是 SITV-SR,通常情况下,单播业务(点播、回看、时移)都从烽火的边缘节点下发,组播业务(直播)都继续上联城域网到中心节点、从文广下发。BAS 通过PPPOE 方式开通标清业务,兼容原 UT 机顶盒;SITV-SR 通过 DHCP(IPOE)方式开通烽火高清、标清业务,目前设备在建,具体是否开通需要属地网管确认。BAS 开通组播,下联设备只是二层接入;SITV-SR 开通组播,需要在 OLT 上开通组播。1.2 BAS 下联1.2.1 双数据分别开通宽带业务和 SI
4、TV 业务到 BAS此种方式各级设备均需确认数据配置、包括 MODEM 或家庭网关。(市区、郊县)机顶盒、PC 机分别通过多口 MODEM 或家庭网关(电话线 RJ11 口接入)固定口将指定的不同 PVC 传给 DSLAM 或 ONU(PON-ADSL)转换为有标签的 VLAN,DSLAM 到 BAS、ONU 到 OLT到 BAS。机顶盒、PC 机通过家庭网关(以太网线 RJ45 口接入)固定口将宽带数据不打标签VLAN、SITV 数据转为有标签 VLAN,经 ONU(PON-LAN)配置数据识别、将宽带数据 VLAN 也打上标签,然后 ONU 到 OLT 到 BAS。所以此种方式开通单业务宽
5、带,可不接家庭网关直接连接 PC 机。1.2.2 单数据开通宽带业务和 SITV 业务到 BAS(郊县)机顶盒、PC 机经多口 MODEM(未设置多 PVC)或家庭网关(未设置标签 VLAN)到 DSLAM 或ONU 转为单数据,DSLAM 到 BAS、ONU 到 OLT 到 BAS。PC 机通过机顶盒网线口上联 ONU 或经单口 MODEM 到 DSLAM 转为单数据,DSLAM 到BAS、ONU 到 OLT 到 BAS。IPTV 常见故障处理手册3第二章 故障排查方法故障排查的一般顺序:先排查用户端的硬件和配置、再按照网络拓扑逐级查找各级设备数据配置、烽火本地节点和中心节点、文广。最好能先
6、确定一下故障发生的范围是单个用户还是一个网络区域的用户。根据故障产生的阶段和现象来决定先排查的方面。2.1 用户端硬件排查硬件故障表现形式是多样的,也是最不好定位的,在登录过程中网络故障、认证故障、收看过程中的各类播放故障都有可能是硬件如机顶盒所产生,所以要先确保装机或修障时硬件正常,有条件的话备用一套在局端测试正常的硬件用于替换、定位硬件环节。2.2 用户端硬件设置排查先进入机顶盒查看网络连接方式、PPPOE 方式确认录入的账号、密码是否正确、认证服务器录入是否正确(默认为 http:/113.0.85.188:6060/aaa/login)。排查完机顶盒后,进入多口 MODEM 或家庭网关
7、确认配置是否正确;根据工单或询问属地网管设备属于双数据规划还是单数据规划用来开通宽带业务和 SITV 业务,由此产生的设置不同。如是双数据规划(市区、郊县),配置 0/35PVC 接 SITV 业务、配置 8/35PVC 接宽带业务,通常是多口MODEM 的 1 口用 0/35、2 口用 8/35,电话线接入的家庭网关用法同多口 MODEM、实际的端口分配设置不知,以太网线口接入的家庭网关是通常是 4 口设置打标签的 SITV-VLAN 接SITV 业务、其它端口不打标签用 1 口接宽带业务。如是单数据规划(郊县),则多口 MODEM或家庭网关不能设置数据,使用功能等同于 HUB 集线器;如是
8、此种设置,则可以直接将网线接入 PC 机或机顶盒查看业务是否正常,用于定位以太网线口接入的家庭网关是否硬件或配置出现故障。2.3 用户账号、密码错误或用户不存在的排查一般情况下 SITV 业务虚拟专线号为 0451L00000006,业务工单上有两组账号,第一组是用户账号如 l00000006kdsj(首字符是小写 L),此账号是在亚信系统认证,由 BAS 下发私网 IP;第二组是 SITV 登录名称或业务账号如 100000006(首字符是将专线号 L 变为数字1),此账号在烽火平台绑定机顶盒。用户不存在先查看工单是否按 UT 用户受理,如是,则退单至营业重新按烽火业务进单;查完用户端配置后
9、,则需要属地网管查询;先进入亚信系统查看 SITV 账号是否存在、正常,校验用户账号、密码,如均正常,则查看各级设备数据配置是否正确。IPTV 常见故障处理手册42.4 接入层 DSLAM 或 ONU、OLT 的排查IPTV 业务的登录、收看均可能来自设备数据配置或设备端口(机率较小)的影响。如是双数据,DSLAM 或 ONU 在用户端口设置没有标签的宽带 VLAN 和有标签的 SITV-VLAN,在上联口打上宽带 VLAN 标签,将双 VLAN 送至 BAS 进入不同域进行帐号认证;此种设置如果更换端口排查端口是否有问题,需要注意新端口数据配置是否完善(注:PON-LAN 的 ONU 如果想
10、配合维护人员排除掉家庭网关硬件,可将宽带数据删除,将 SITV-VLAN 改成 UNTAG 的,则入户网线可直连机顶盒进行拨测)。如是单数据规划,DSLAM 或 ONU 在用户端口设置没有标签的单 VLAN,在上联口打上 VLAN 标签,将 VLAN 送至 BAS 通过帐号区别认证;此种设置一般情况下设备数据预设不打标签的单 VLAN,端口不需重配,可直接拨测 SITV 业务(注:PON-LAN 的 ONU 维护人员想排除掉家庭网关硬件,可将入户网线直连机顶盒进行拨测,不用属地网管配合)。SITV 业务之所以可以如此拨测,是因为 SITV 账号在亚信不进行绑定;但宽带业务如更换端口测试必须属地
11、网管配合将宽带账号重新改绑或临时解绑。本层还配合维护人员查看端口线质、端口开通速率等信息,来排除线路对宽带业务和 SITV 业务播放如卡片、马赛克等影响。2.5 BAS 或 SITV-SR(在建或部分区域已用)的排查数据无论到 BAS 还是 SITV-SR,通常情况下,单播业务(点播、回看、时移)都从烽火的边缘节点下发,组播业务(直播)都继续上联城域网到中心节点、从文广下发。BAS 通过PPPOE 方式开通标清业务,兼容原 UT 机顶盒;SITV-SR 通过 DHCP(IPOE)方式开通烽火高清、标清业务,目前设备在建,具体是否开通需要属地网管确认。BAS 开通组播,常见如爱立信 SE800
12、是在全局模式下开通组播,华为 ME60 是在光口子口下针对业务 VLAN 开通组播;所以郊县网管需要注意单数据 VLAN 规划开双业务时,华为 ME60 需要属地网管查询业务VLAN 是否已开通组播;SITV-SR 开通组播,需要在 OLT 上开通组播,由于设备在建,接触不到这方面相关资料,所以不做详述、待完善。2.6 烽火平台和文广系统的排查烽火平台或更换机顶盒受理电话:82110290文广电话:87018662,87011801,87011802EPG 界面出现故障,播放过程中直播、点播出现的各类故障,都有可能是平台故障。平台归烽火,片源归文广。先要确定故障范围,是大面积、某一 BAS 光
13、口所带、某一接入设备还是单个用户出现故障,现象是否相似;播放时是直播故障还是点播故障,如直播不正常或卡片,则用回看返回再看以帮助判断是否片源问题需要找文广还是烽火中心节点问题,其次是查看点播是否正常以帮助判断是否烽火边缘节点出问题。大面积故障是平台或片源的可能性要高一些,单个用户故障这方面的可能性要小一些,但在实际维护中也出现过。无论是 SITV 业务账号还是机顶盒,只要正常登录就会在烽火平台留有绑定信息,如更换机顶盒需要找烽火进行机顶盒和 SITV 业务账号的解绑。以上是对故障排查的简述,装机维护时需要具体实践来决定排查的方向和顺序。IPTV 常见故障处理手册5第三章 机顶盒启动的进度条分析
14、机顶盒的启动要经历网络连接、软件读取载入、认证鉴权、访问 EPG 服务器读取节目界面,最后通过 EPG 界面(节目菜单)的操作,用户实现 IPTV 的内容浏览、播放自己喜欢的节目。机顶盒的启动中会有明显的进度条按百分比进行显示,通过进度条表现出来较明显的为 7%、47%、52%、85%及 98%,机顶盒启动阶段可能的故障现象如下:3.1 开机进度条在 7%或 47%之前停住的为网络故障这个阶段出现故障,说明在网络接入上有问题;如果进度条停留在 7%则可以确定为网络线路或 PPPOE 拨号账号错误问题,检查线路,检查机顶盒账号配置即可,如用 PC 拨测IPTV 账号正常,则可能是机顶盒故障。3.
15、2 开机进度条停留在 47%-52%-85%之间为机顶盒硬件出现硬件损坏的故障需要解绑故障机顶盒,更换机顶盒;其中 47%-52%是机顶盒本身载入软件的阶段。3.3 开机进度条停留在 85%98%为业务账号认证无法通过的故障通常会提示“用户不存在”或“用户机顶盒已经绑定”,遇到此类问题首先进后台确定账号设置框中是否有多余乱码或账号末尾是否有空格并确定机顶盒型号;如为 UT 平台升级的用户在账户设置无乱码、空格的情况下则为用户数据漏迁;如为新开户用户则为营业厅自迁移日期后仍将用户账户创建在了 UT 平台,要求将工单返回营业厅重新办理。如至87%卡死,一般都可以确定为 AAA 认证鉴权出了问题,这
16、个阶段出现问题,最有可能是机顶盒在 IPTV 后台之间的通信及认证上存在问题,需要逐一排查具体原因;原因有可能是用户接入线路出现丢包、机顶盒与 IPTV 后台之间的通信出现故障、业务账号用户名 /密码错误(无法通过 IPTV-USC 服务器的认证)、DNS 域名无法解析、业务账号与机顶盒的绑定错误、机顶盒故障等。3.4 开机进度条停留在 98%的故障到此阶段可确认已建立了与服务器的连接,并通过了 IPTV 平台的认证,AAA 下发访问地址进入读取 EPG 画面阶段,故障最大的可能就是 IPTV 平台的 EPG 服务器出现故障。故障中最难定位的是从机顶盒至局端烽火平台途经的设备硬件故障,现实维护
17、中只能逐级用甩开或替换来定位硬件故障,所以有条件的情况下,最好备用测试正常的硬件用来IPTV 常见故障处理手册6替换排查硬件故障。下面拿前面的一个故障示例来讲述一下当时的排查过程:现象-直播只能看中央 1 台,其它直播频道、回看、点播均黑屏。排查过程-先查看连线正常,机顶盒在局端测试正常。因为网络是单数据 VLAN 开通双业务,宽带业务正常,SITV 业务能看到直播的少量频道,用户端的家庭网关功能等同于HUB,所以查看网络。联系属地网管查看上接 PON-LAN 的 ONU 数据正常,上连的 BAS华为ME60 数据正常、组播正常开启;因为单播(回看、点播)也异常,联系烽火查看边缘节点正常。由于
18、用户是单点故障,至此,又重新排查硬件,维护人员将用户端的家庭网关排除,用网线直连机顶盒,SITV 各业务恢复正常;由此知晓是家庭网关硬件故障导致。如果仍未排除,就需要更换 ONU 设备端口来排除 ONU 端口硬件故障;再未排除,就需要烽火厂家配合查找故障原因。第四章 故障分类及案例由机顶盒的启动流程看我们可以总结出故障可以分为二大类,尚未进入 EPG 首页面在登录过程中出现的故障和成功登陆 IPTV 系统后在收看过程中出现的故障。而尚未进入 EPG首页的故障又分为1、网络故障 2、机顶盒故障 3、割接升级故障 4、业务故障4.1 尚未进入 EPG 首页面的故障4.1.1 网络故障举例:1)、现
19、象:出现错误界面,显示“无法连接到网络” ,在用户家检测到网络正常。排查及解决方法:经查是网线水晶头损坏,更换网线后恢复正常。2)、现象:错误代码“101” ,在用户家检测到网络连接不通。排查及解决方法:用户家的 MODEM 长时间不关导致发热引起的连接不畅,重启 MODEM后正常。3)、现象:错误代码“101” ,在用户家检测到网络连接不通。排查及解决方法:用户家的 MODEM 损坏,更换 MODEM 后正常。4)、现象:错误代码“101” ,在用户家检测到网络连接不通。排查及解决方法:检查帐号配置都对,连线无错误,找属地网管检查端口数据未配置,配置后正常接入。5)、现象:错误代码“101”
20、 ,在用户家检测到网络正常。排查及解决方法:PPPOE 输入账号错误,重新输入后正常登陆。6)、现象:错误代码“101” ,在用户家检测到网络正常。排查及解决方法:经查机顶盒设置界面登录模式一栏默认为 DHCP 模式,将模式改为PPPOE 模式后恢复正常。7)、现象:错误代码“102” ,在用户家检测到网络连接不通。排查及解决方法:网络不通,属地网管处理后恢复正常。8)、现象:错误代码“404” ,在用户家检测到网络连接不通。IPTV 常见故障处理手册7排查及解决方法:用户家的 MODEM 长时间不关导致发热引起的连接不畅,重启 MODEM后正常。9)、现象:错误代码“404” ,在用户家检测
21、到网络连接不通。排查及解决方法:网络不通,用户终端设备连接不良导致。10)、现象:用户每日首次开机都会出现“404”报错页面。排查及解决方法:用户使用习惯为机顶盒和网络设备同时开机,升级之后系统反应速度比原 UT 系统快,在拨号未拨通时就已进入 EPG 页面,故显示 404 错误码;此时可按“首页”键重新刷新,刷新后即可进入 EPG 首页正常观看。11)、现象:错误代码“1014” ,登录过程中进度条停留在 8%。排查及解决方法:PPPOE 账号输入错误。12)、现象:错误代码“1305” ,网络连接不通。排查及解决方法:账户设置错误,修改后必须拔电重启。13)、现象:错误代码“1403” ,
22、宽带用户名不正确。排查及解决方法:账户设置错误,修改后必须拔电重启。14)、现象:错误代码“1403” ,新开用户机顶盒配置后提示网络接入失败。排查及解决方法:检查帐号配置都对,连线无错误,找属地网管检查端口数据未配置。配置后正常接入。15)、现象:错误代码“1404” ,新开用户机顶盒配置后提示网络接入失败。排查及解决方法:检查帐号配置都对,连线无错误,找属地网管检查端口数据未配置。配置后正常接入。16)、现象:机顶盒接多口 MODEM 的一口可正常使用,宽带业务接一口也正常可用,但接到二口上,就出现 1404 错误(网络接入故障) 。排查及解决方法:处于双数据分别开双业务网络,这种情况应该
23、是多口 MODEM 的二口没有正确配置,请检查二口的 VPIVCI 值是否正确。其他项可参照一口配置,看是否有问题。遇到这种情况,可先换个 MODEM,看是否可以正常使用,由此来判断是否为配置问题。17)、现象:错误代码“1404” ,新开用户机顶盒配置后提示网络接入失败。排查及解决方法:检查帐号配置都对,连线无错误,找属地网管先去掉端口上宽带8/35-PVC,IPTV 正常登录,说明宽带数据配置错误。18)、现象:电视机已打开但是出现蓝屏或黑屏,未能进入 IPTV 主界面。排查及解决方法:查看机顶盒电源指示灯亮不亮a 如果机顶盒电源指示灯不亮:原因 1:电源线未连接或未开机处理方法:请用户确
24、认电源线连接正确:机顶盒的电源接口位于机顶盒背后的最右侧。请用户确认已按下机顶盒的开机键原因 2:确认连接的无误,判断为机顶盒接触不良处理方法:通知用户等待更换机顶盒。b 如果机顶盒电源指示灯亮:原因 1:电视机与机顶盒的视频线连接不正确或者电视机未正常工作。处理方法:提示用户检查电视机与机顶盒的视频线连接并确保电视机正常工作。黄色视频接口与电视机的黄色视频接口连接,红、白色音频接口分别与电视机的红、白色音频接口连接。原因 2:电视机的画面模式切换不对IPTV 常见故障处理手册8处理方法:提示用户按电视机遥控器“av”或“视频”按钮,切回 IPTV 机顶盒所用视音频通道。4.1.2 机顶盒故障
25、举例:1)、现象:提示“http status error 404”错误,用户的机顶盒开机过程中有时不能登录系统首页;机顶盒在 EPG 界面选择过程中,EPG 响应很慢,时常出现响应失败;机顶盒在播放直播频道过程中有时候会出现卡顿、花屏;机顶盒在播放回看节目过程中退出回看节目播放,机顶盒进入“page error”界面;机顶盒在播放回看节目过程中退出回看节目播放,机顶盒进入“http status error 404”界面。排查及解决方法:更换用户机顶盒并重新输入用户 PPPOE 账号和密码、业务账号和密码后再次启动机顶盒,机顶盒正常登录烽火系统。机顶盒 EPG 响应速度恢复正常,机顶盒播放与
26、退出节目不再进入报错页面,观察机顶盒外观发现机顶盒外表有很多灰尘粘附,网卡接口也有很多灰尘粘附。所以推断该机顶盒是由于网卡接口接触不良导致的播放效果差和使用故障。此现象也有可能是网络故障导致。2)、现象:机顶盒网口故障,用户更换的机顶盒不能登录系统,页面显示网络连接失败。排查及解决方法:开始以为用户的网络有故障,替换一个机顶盒进行连接,机顶盒进入页面中提示用户已经绑定机顶盒,于是判断用户的网络是正常的。为了判断我们查询到的该用户的 PPPOE 账号和密码的正确性,于是将该用户的 PPOE 账号和密码输入到刚刚登录时出现异常提示的机顶盒中,机顶盒仍然进入提示用户已经绑定机顶盒页面,所以确认PPP
27、OE 账号和密码是正确的。再使用原来的机顶盒登录,总是在登录过程中提示网络中断,于是推断这个机顶盒的网口有故障,然后再次更换机顶盒并重新输入 PPPOE 账号和密码、业务账号和密码,对业务账号解除绑定后机顶盒登录烽火系统成功,测试频道直播、回看、电影点播等业务均正常。3)、现象:机顶盒配置完成后,到 85%出现提示“访问的页面不存在”选择返回或重新配置。排查及解决方法:更换机顶盒。4)、现象:电话报故障为机顶盒升级后播放、点播、回看均出现黑屏和 404 错误,间隔时间为 1 小时;与用户联系用户称现在开机 4-10 分钟就出现电话报修的故障现象。排查及解决方法:初步判断为机顶盒故障,更换机顶盒
28、后恢复正常。4.1.3 割接升级故障举例:1)、现象:机顶盒升级过程中断电升级失败,用户机顶盒开关上的电源指示灯一直显示红色,无论怎么按电源,电源的指示灯都只显示红色,机顶盒不能启动。排查及解决方法:与用户进行沟通后了解到,用户描述为在机顶盒的升级页面看到了“请关闭电源”字样,我们的机顶盒升级过程中显示的为“请勿关闭电源”字样,由此可以推断用户进行了误操作。于是用同类型的可以正常登录烽火系统的机顶盒进行了更换,并重新输入了用户的 PPPOE 账号和密码、IPTV 的业务账号和密码,机顶盒可以正常登录烽火系统。IPTV 常见故障处理手册92)、现象:升级后提示“用户不存在” , 用户操作机顶盒在
29、线自动升级后,机顶盒重启后不能登录系统,进入的页面显示内容包含“用户不存在”等字样。排查及解决方法:重启机顶盒进入机顶盒的配置页面,查看业务账号发现业务账号后面的框格中为空白,此时可以推断机顶盒升级后丢失了用户的业务账号,于是将用户的业务账号重新添加,同时确认业务账号框格中无其他隐藏字符,如果存在隐藏字符则将其删除,操作完成后重启机顶盒可以正常登录烽火系统。3)、现象:升级过程中显示不存在该账户,错误代码“2001” 。排查及解决方法:重启机顶盒进入机顶盒的配置页面,查看业务账号。处理的示例有业务账号后面带有空格,将空格消除重新输入业务账号后恢复正常;业务账号密码输入错误,默认都是 6 个 8
30、,该账户输入密码为 123456;业务账号输入为英文字母 L 开头的,输入错误的输入方式,将字母 L 变为数字 1 后恢复正常。4) 、现象:机顶盒升级后按键失灵,用户开机后按出现提示将旧 UT 机顶盒升级后机顶盒左右“”两个选择键失灵。排查及解决方法:故障可能是该机顶盒按键确实物理损坏或机顶盒输入接口芯片硬件特殊,升级后新固件的软件 BUG 造成的设备故障。首先用遥控器尝试选择节目菜单确定是否可以操作,如果可以选择则确定故障为新软件升级后的软件 BUG;如果遥控器也不能选择则为机顶盒的整体故障;如为软件 BUG 造成的故障将在下一次升级后问题得到解决,提示用户使用遥控器操作,如果无遥控器则为
31、用户提供暂用的遥控器;机顶盒整体故障则更换机顶盒。5) 、现象:迁移后机顶盒仍访问旧的 UT 平台,无法接入新平台,识别为 EPG 界面仍无“高清”节目选单。排除及解决方法: 旧的 UT 机顶盒为特殊型号,硬件与通用机顶盒有较大差别;解决方法为查看用户的机顶盒发现机顶盒硬件版本为 MC1018G,此硬件型号的机顶盒暂时不支持自动升级到烽火系统,所以要进行机顶盒更换,并且重新输入用户的 PPPOE 账号和密码以及 IPTV 业务账号和密码后即可登录烽火系统;检查如为非 M1080G 型号的 UT 机顶盒,则抄写机顶盒 ID 信息请求网关中心重新配置该用户升级策略,如还不能升级装机人员可以更换机顶
32、盒,运维支撑人员拿到此类的盒子则可以尝试离线升级的方法进行升级。6)、现象:升级完成后,机顶盒正常观看,但是网络连接不上,显示错误“678” 。排除及解决方法:用户为光纤用户,必须使用网关进行连接。4.1.4 业务故障举例:1)、现象:用户开机后,出现了错误提示页面,提示“认证失败,错误码:2001,用户不存在”。排查及解决方法:如果是新开户,确认装机员装机时配置无误,然后在 ESS 系统上查询该用户专线号是否存在,若工单受理为 UT 用户,则退单至营业将该用户重新开户到烽火系统。如果是 UT 系统平移的老用户,则可能是该用户数据没有导入到烽火系统中,通知烽火工程师处理。2)、现象:机顶盒提示 2212 错误,用户机顶盒已经绑定。排查及解决方法:如果为新机顶盒,可以联系文广,进行解绑后再确认是否正常。如果为旧机顶盒升级失败,换新机顶盒仍出现此错误,同样联系文广解绑后正常使用。注:如果一次解绑后仍然出现此错误,可多解绑几次,有可能为解绑不成功。3) 、现象:提示产品未订购,升级后节目选单中“高清”频道打开时提示产品未订购。