1 交换网络环境的故障诊断( 二 )


交换机配置可以通过上面提到的2种方法查看 , 虽然问题不一定是配置引起的 。不管问题是操作系统有BUG还是配置不完善 , 都不能从配置列表中轻易的查看出 。配置信息在定位交换机是否像预期的那样运行上比较有用 , 但针对故障诊断就不是了 。为了验证交换机的配置 , 往往需要使用多种的交换机故障诊断方法配合 。
很多交换机都带有实时的故障诊断工具 , 因为交换机生产厂家和型号的不同 , 这些故障解决工具的特征也各不相同 。但是要使用好这些工具 , 必须依靠一定的理论知识和实际经验 。
方法2:连接到一个空闲端口
最简单的故障诊断方法是在交换机的空闲端口接入一个监测工具 , 例如协议分析仪 。
图3、从任意端口监测
把监测工具接入交换机的一个空闲端口 , 不用中断服务就可以查看所属广播域 。该监测工具与广播域里的其他站点一样有相同的权限 。
不幸的是 , 交换机(做为一个多端口的桥接设备)几乎不转发流量到监测端口 。因为桥接设备就是这样设计的 , 流量直转发到所属的目的端口 , 不会去其他的端口 。协议分析仪因此几乎监测不到流量 。
图4、交换机在源端口和目的端口之间转发流量 。非常少的流量会转到其他端口 。站点和服务器之间可能每秒钟会转发几千个帧 , 但是监测端口每分钟只能看到几个帧
转发到监测端口的流量几乎全部都是广播 , 包含一些零星的目的地址不明的帧 。这些零星的帧是由于路由转发表老化的结果 , 经常是目的端口不明的帧 。一些经验不够的技术人员看到这么高的广播(接近100%) , 却没有注重到端口利用率很低 , 就误判网络出现了广播风暴 , 其实不是 。

这样查看交换网络几乎没有用 , 因为监测工具必须获取流量 。获得的流量或者对广播域的查询对网络搜索和发现其他类型问题是有很有帮助的 , 但对解决用户连接慢的问题并没有多大的帮助 。
对大多数交换机来说 , 都有一个更好的选择 , 可以把需要监测的端口流量备份到一个专门的空闲口 。这种技术通常称为端口镜像 。
大多数交换机厂家都提供备份或镜像流量的功能 , 可以把监测工具接入交换机一个专门配置过的端口 。老的交换机必须指定一个专门的监测口做为镜像口 , 但现在大多数新的交换机可以指定任何一个端口做为镜像口 。
虽然交换机厂家实现镜像的方式各不相同 , 但是有一些基本相同的监测选项 。值得注重的是 , 几乎在所有的情况下 , 交换机在转发流量到镜像口的时候 , 同时把错误都过滤掉了 。对于故障诊断来说 , 这意味着同时过滤掉了有用的信息 。
此外 , 实际操作当中需要我们通过控制口(交换机的RS232端口) , 或者Telnet进程来配置镜像 。这意味着除了监测工具之外 , 我们通常还需要带一台电脑或者终端来对交换机进行配置 。
镜像端口经常只是一个“监听”端口 , 不过很多交换机厂家答应把该端口配置成全双工的 。配置了镜像口 , 监测工具就可以查看报告连接慢的主机和服务器之间的实际流量的备份 。镜像口可以只监测交换机的任意一个端口 , 甚至可以是Uplink口 , 也可以同时监测交换机的多个端口 。但是同时监测的端口很多的话 , 过高的流量就有可能会超过镜像口的接收能力 。
监测端口的输出能力是一个很重要的问题 。镜像口可以收 , 也可以发 。在配置的时候 , 经常关掉了镜像口发的功能 。但不管有没有关掉镜像口发的功能(不管镜像口是全双工或者不是) , 镜像口的接收能力都是有限制的 。假如被监测的全双工端口的速率和镜像口是一样的话 , 交换机在转发流量的时候很轻易就会丢包 , 但是交换机不会通知您 。

推荐阅读