1、探讨网络故障诊断与处理摘 要网络故障是指硬件的问题、软件的漏洞、病毒的侵入等可以引起网络的故障。网络故障带来了很多烦恼,轻则影响用户网络运行质量,重则导致整个网络瘫痪,带来巨大的经济损失。在网络出现故障时要做到及时发现网络故障、准确定位网络故障并且能及时排除故障就显得特别重要。 关键词网络;故障;诊断分析;处理对策 中图分类号:G250.72 文献标识码:A 文章编号:1009-914X(2015)06-0110-01 1 前言 随着电子政务、企业信息化和电子商务的迅速发展,计算机网络正在融入社会生活的各个方面。计算机网络的广泛应用带来了许多便利,人们对网络的稳定运行提出越来越高的要求。但随之
2、而来的网络故障也带来了很多烦恼,轻则影响用户网络运行质量,重则导致整个网络瘫痪,带来巨大的经济损失。在网络出现故障时要做到及时发现网络故障、准确定位网络故障并且能及时排除故障就显得特别重要。 2 按照网络故障不同性质 2.1 物理故障 指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。例如,网络管理人员发现网络某条线路突然中断,首先用 ping 或 fping检查线路在网管中心这边是否连通。ping 的格式为:ping 192.168.0.1 (192.168.0.1 是 ip 地址,可以是主机的 ip 也可以是网络中另一台计算机的 ip) 。ping 一般一次只能检测到一端到另一端
3、的连通性,而不能一次检测一端到多端的连通性,但 fping 一次就可以 ping 多个 ip 地址,比如 c 类的整个网段地址等。顺便多说一句,网络管理员经常发现有人依次扫描本网的大量 ip 地址,不一定就是有黑客攻击,fping 也可以做到。如果连续几次 ping 都出现“requst time out“信息,表明网络不通。这时去检查端口插头是否松动,或者网络插头误接,这种情况经常是没有搞清楚网络插头规范或者没有弄清网络拓扑规划的情况下导致的。另一种情况,比如两个路由器 router 直接连接,这时应该让一台路由器的出口连接另一台路由器的入口,而这台路由器的入口连接另一路由器的出口才行。当然
4、,集线器 hub、交换机、多路复用器也必须连接正确,否则也会导致网络中断。 2.2 逻辑故障 逻辑故障中最常见的情况就是配置错误,就是指因为网络设备的配置原因而导致的网络异常或故障。配置错误可能是路由器端口参数设定有误,或路由器路由配置错误以至于路由循环或找不到远端地址,或者是路由掩码设置错误等。比如,同样是网络中的线路故障,该线路没有流量,但又可以 ping 通线路的两端端口,这时就很有可能是路由配置错误了。遇到这种情况,我们通常用“路由跟踪程序”就是 traceroute,它和 ping 类似,最大的区别在于 traceroute 是把端到端的线路按线路所经过的路由器分成多段,然后以每段返
5、回响应与延迟。如果发现在traceroute 的结果中某一段之后,两个 ip 地址循环出现,这时,一般就是线路远端把端口路由又指向了线路的近端,导致 ip 包在该线路上来回反复传递。幸好 traceroute 可以检测到哪个路由器之前都能正常响应,到哪个路由器就不能正常响应了。这时只需更改远端路由器端口配置,就能恢复线路正常了。逻辑故障的另一类就是一些重要进程或端口关闭,以及系统的负载过高。比如也是线路中断,没有流量,用 ping 发现线路端口不通,检查发现该端口处于 down 的状态,这就说明该端口已经关闭,因此导致故障。这时只需重新启动该端口,就可以恢复线路的连通了。还有一种常见情况是路由
6、器的负载过高,表现为路由器 cpu 温度太高、cpu 利用率太高,以及内存剩余太少等,如果因此影响网络服务质量,最直接也是最好的办法就是更换路由器。 3 按照网络故障不同对象 3.1 线路故障 线路故障最常见的情况就是线路不通,诊断这种情况首先检查该线路上流量是否还存在,然后用 ping 检查线路远端的路由器端口能否响应,用 traceroute 检查路由器配置是否正确,找出问题逐个解决。 3.2 路由器故障 线路故障中很多情况都涉及到路由器,因此也可以把一些线路故障归结为路由器故障。检测这种故障,需要利用 mib 变量浏览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器 cpu 的
7、温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程不断地检测路由器的关键数据,并及时给出报警。而路由器 cpu利用率过高和路由器内存余量太小都将直接影响到网络服务的质量。解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。 3.3 主机故障 主机故障常见的现象就是主机的配置不当。包括主机配置的 IP 地址与其他主机冲突,或 IP 地址根本就不在于网络范围内,这将导致该主机不能连通。发生类似的情况,可通过查看网络邻居属性中的连接属性窗口,检查 TCP/IP 选项参数是否符合要求,包括 IP 地址、子网掩码、网关和 DNS 参数,对错误的设置进行修复
8、。 主机安全性故障 主机主机性故障包括主机资源被盗和黑客入侵。对于主机资源要注意不要轻易地共享本机硬盘;对于主机被黑客 控制的故障可以通过监视主机的流量、扫描主机端口和服务,安装防火墙和加补系统补丁来防止可能的漏洞。 实例:传输上百兆数据时出现“网络资源不足”的提示。按常规,网络故障一般不排除以下几点:网卡有问题、水晶头做得不规范、网线有问题、网卡驱动或网络协议有问题等。但是根据故障现象来看,以上猜测都可以排除,因为任何一个地方存在问题,就不可能在微机之间进行数据传输,从而可以判断问题应该出在环境因素上。由于大量的数据传输需要频繁的数据读取,这就要有一个相对平稳的传输环境,而网卡附近有干扰时,这种平稳的环境就会被破坏。一般要确保网卡不插在离显卡很近的插槽上,因为现在的显卡一般都带有风扇,而显卡风扇将影响到网卡的工作,尤其是显卡在频繁工作时,影响将更加明显。把网卡拔下来,插到离显卡一个较远的插槽上,即可解决大量数据传输时出现的问题。 参考文献 1 范慧霞,杨静,郑喜珍.局域网常见故障分析及解决方法J.科技信息(学术研究). 2007(32). 2 崔凯.智能型网络故障诊断系统研究J.河南教育学院学报(自然科学版).2013(03).