配置为增强模式时,qos burst-mode(接口视图)命令与qos burst-mode(系统视图)命令不能同时配置,且上述两条命令均不能与qos queue length命令同时配置。
重新执行步骤1,检查端口Discard计数是否增加。
• 如果不增加,则拥塞问题解决。观察丢包现象是否解决,如果未解决,请跳过该节,参考检查是否存在环路进行问题定位。
• 如果仍然增加或设备不支持qos burst-mode命令,则需要优化网络,请执行下一步。
3. 优化网络。
一般从以下方面考虑,来进行网络优化:
• 端口扩容
如果有多条流量冲突,可以扩大设备之间的链路带宽,或者用Eth-Trunk增加成员端口负载分担。
• 对设备的上行流量做限速或进行流量整形
突发是造成网络中无规则丢包的主要原因,当突发的尺寸超过端口缓存的限制时,就会存在业务丢包,从而可能影响到客户的业务。从这方面来说,在上游设备对用户的数据做限速或
进行流量整形,在一定程度上可以减少突发的产生或者减少突发尺寸,在下行设备上出现突发的拥塞丢包的可能性就会降低。
X系列单板设备可以支持HQoS,提供精细化的QoS服务。HQoS通过多级队列进一步细化区分业务流量,对多个用户、多种业务等传输对象进行统一管理和分层调度,更能保证业务流
量的公平性以及平稳性。
• 对端口业务进行差分服务,关键业务入高优先级队列,在拥塞时得到优先处理
一般而言,接口上承载的业务比较多,有高优先级的业务(如语音,视频业务),也有低优先级的业务(如上网业务)。对于高优先级的业务在上行设备指定不同的优先级,或者在设
备的入方向进优先级映射,确保在出方向时,关键业务入高优先级队列,在出方向配置PQ调度,确保高优先级的业务能够得到优先调度。
• 如果设备使用了组播业务,通过调整组播源服务器发包方式,对服务器发包优化,减小发生流量拥塞的情况。
小窍门:拥塞丢包的界定
端口丢包日志
对于业务端口,交换机支持定时监控端口的拥塞丢包计数。如果在统计周期内丢包计数超过阈值,则会记录丢包日志。日志格式如下:
IFPDT/4/PKT_OUTDISCARD_ABNL:Interface output discard exceeded the log threshold. (Interface=[STRING], Statistics=[STRING], LogThreshold=[ULONG], LogInterval=[ULONG](s))
IFPDT/4/PKT_OUTDISCARD_ABNL:Interface output discard exceeded the log threshold. (Interface=[STRING], Statistics=[STRING], LogThreshold=[ULONG], LogInterval=[ULONG](s),PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING], PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING],PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING], PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING],PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING], PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING],PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING], PortQueueNumber=[ULONG], PortQueuePassed=[STRING], PortQueueDropped=[STRING])
表1 拥塞丢包日志在各形态设备及版本的支持情况
形态 V200R003 V200R008 V200R010 V200R011及后续版本
框式交换机 SPH023补丁默认开启定时统计,每5
分钟丢包计数超过300个,则会记录丢
包日志。
SPH013补丁默认开启定时统计,每5分
钟丢包计数超过300个,则会记录丢包日
志。之前的补丁版本可以通过命令log-
thresholdoutput-discard配置。
SPH005补丁默认开启定时统计,每5分
钟丢包计数超过300个,则会记录丢包日
志。之前的补丁版本可以通过命令log-
thresholdoutput-discard配置。
默认开启定时统计,每5分钟丢包计数超过300
个,则会记录丢包日志。
盒式交换机 不支持 默认不开启,可以通过命令log-
thresholdoutput-discard配置。
默认不开启,可以通过命令log-
thresholdoutput-discard配置。
默认开启定时统计,每5分钟丢包计数超过300
个,则会记录丢包日志。
对于内部单板互联通道HG端口,每5分钟检测一次HG端口的拥塞丢包计数,如果在检测周期内存在丢包计数,则记录丢包日志。日志格式如下:
ALML/3/DISCARD_PKT: Packets are discarded for congestion. (SlotID=[STRING1], UnitID=[INTEGER], PortID=[STRING2], PeerSlotID=[STRING3], DiscardNumber=[STRING4])
表2 HG端口拥塞丢包日志在各形态设备及版本的支持情况
形态 V200R003 V200R008 V200R009及后续版本
框式交换机 SPH013补丁支持 SPH011补丁支持 支持
盒式交换机 不支持 不支持 支持
端口拥塞风险日志预警
交换机定时轮询设备端口缓存的使用情况。如果缓存使用超过阈值,则选取缓存占用较多,存在拥塞风险的端口记录日志。日志格式如下:
QOSE/4/CONGESTIONRISK:There is a congestion risk on port [string].
表3 端口拥塞风险日志预警在各形态设备及版本的支持情况
形态 V200R003 V200R008 V200R010 V200R011及后续版本
框式交换机 SPH021补丁 SPH011补丁 SPH003补丁 支持
盒式交换机 不支持 不支持 SPH003补丁 支持
使用Wireshark分析确定突发
有时候,通过display interface命令(或者在网管上监控端口带宽)查看端口带宽使用率可能只有30%~40%,端口流量的Output peak rate字段也不大,会误认为不可能存在流量超过端口转发能
力导致丢包的现象。这是由于突发一般都是毫秒级别的,当前的端口流量统计、网管监控软件的统计周期一般都是秒级或者分钟级别,并不能反映毫秒级别的微观流量情况。通常情况下使用报文获
取软件可以证明网络中存在流量突发的情况。
下面介绍如何通过Wireshark软件分析来判断流量是否存在突发。
1. 使用Wireshark软件打开获取到的报文。
图3 获取到的报文
2. 在工具栏中选择Statistics中的IO Graph页面。