交换网络环境的故障诊断( 二 )


即使把这些方式组合起来 , 也不能监测到所连接的网络 , 在交换的环境里面 , 也不像集线器那样方便监测 。我们几乎不可能看到通过一个交换机的全部流量 。大多数的故障诊断会假设流量会在站点和所连接的服务器之间或经过故障诊断交换机uplink口通过 。而实际上假如2台主机直接传输信息的话 , 就不会使用交换机的uplink口或者任何其他的端口来交换流量 。除非你知道具体用到哪个端口 , 否则是监测不到的 。
举个例子 , 如图1 , 一台服务器接入一台交换机 。在反映有问题的用户中 , 一部分是直接与这台交换机相连 , 另外的一部分用户是由这台交换机的uplink口从其他路由器或者交换机连接上来的 。故障报告是访问服务器“慢” , 这样的故障报告对技术支持工程师来说基本上没有任何价值 。
图一、一个最基本的交换机环境
方法1:通过TELNET或者串行口接入服务器
高级的网络技术支持工程师或其他知道交换机密码的人在进行故障诊断时可以选择通过TELENET或者交换机的串口登陆 , 来检查交换机的配置 。(如图2)
图2、使用RS-232控制端口

;交换机配置可以通过上面提到的2种方法查看 , 虽然问题不一定是配置引起的 。不管问题是操作系统有BUG还是配置不完善 , 都不能从配置列表中轻易的查看出 。配置信息在定位交换机是否像预期的那样运行上比较有用 , 但针对故障诊断就不是了 。为了验证交换机的配置 , 往往需要使用多种的交换机故障诊断方法配合 。
很多交换机都带有实时的故障诊断工具 , 因为交换机生产厂家和型号的不同 , 这些故障解决工具的特征也各不相同 。但是要使用好这些工具 , 必须依靠一定的理论知识和实际经验 。
方法2:连接到一个空闲端口
最简单的故障诊断方法是在交换机的空闲端口接入一个监测工具 , 例如协议分析仪 。
图3、从任意端口监测
把监测工具接入交换机的一个空闲端口 , 不用中断服务就可以查看所属广播域 。该监测工具与广播域里的其他站点一样有相同的权限 。
不幸的是 , 交换机(做为一个多端口的桥接设备)几乎不转发流量到监测端口 。因为桥接设备就是这样设计的 , 流量直转发到所属的目的端口 , 不会去其他的端口 。协议分析仪因此几乎监测不到流量 。
图4、交换机在源端口和目的端口之间转发流量 。非常少的流量会转到其他端口 。站点和服务器之间可能每秒钟会转发几千个帧 , 但是监测端口每分钟只能看到几个帧
转发到监测端口的流量几乎全部都是广播 , 包含一些零星的目的地址不明的帧 。这些零星的帧是由于路由转发表老化的结果 , 经常是目的端口不明的帧 。一些经验不够的技术人员看到这么高的广播(接近100%) , 却没有注重到端口利用率很低 , 就误判网络出现了广播风暴 , 其实不是 。
这样查看交换网络几乎没有用 , 因为监测工具必须获取流量 。获得的流量或者对广播域的查询对网络搜索和发现其他类型问题是有很有帮助的 , 但对解决用户连接慢的问题并没有多大的帮助 。
对大多数交换机来说 , 都有一个更好的选择 , 可以把需要监测的端口流量备份到一个专门的空闲口 。(见图5)这种技术通常称为端口镜像 。
图5、配置镜像口的逻辑效果
大多数交换机厂家都提供备份或镜像流量的功能 , 可以把监测工具接入交换机一个专门配置过的端口 。老的交换机必须指定一个专门的监测口做为镜像口 , 但现在大多数新的交换机可以指定任何一个端口做为镜像口 。

推荐阅读