1、故障现象
在集群各项配置都完成且重新启动设备以后,使用display css status命令查看集群状态,发现“CSS status”为“--”或“single”(单框集群),表示集群系统没有建立成功。
2、可能原因
1、集群线缆没有插好,插头松动
2、集群线缆连接错误
3、集群功能未使能
4、集群卡或集群线缆故障
3、处理步骤
请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。
1、在用户视图下执行命令terminal monitor和terminal trapping,打开告警信息开关,观察是否有集群线缆连接错误(LE0D0VSTSA00、ES02VSTSA集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.4 hwCssConnectError和1.3.6.1.4.1.2011.5.25.183.3.3.2.19 hwCssPhyCardConnectError。EH1D2VS08000集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.15 hwCssPhyVs08ConnectError)。
如果没有告警,直接执行后面步骤2。
如果有告警,则根据告警提示信息处理。
如果有告警,表示两台交换机已经使能集群功能,且集群卡已经正常上电工作,否则集群管理模块无法检测到链路的连接情况。
从告警信息中,可以获取以下信息:
错误的连接信息,根据集群机框ID、槽位号和集群口号,可以直接找出连接错误的线缆。
正确的连接方式。
如设备不断打印告警:
Mar 31 2010 10:53:43 SYS-136 CSSM/4/CSSCONNECTERROR:OID 1.3.6.1.4.1.2011.5.25.183.3.3.2.4 Connect error, 2/13 CSS port 3 link to 1/14 port 2, this port should link to 1/13 port 2
此告警表示:框2槽位13的主控板上集群卡3号集群口连接到了框1槽位14的主控板上集群卡2号集群口,应该连接到框1槽位13的主控板上集群卡2号集群口。
按照告警信息排除故障:
如果集群系统仍然不能建立:
如果仍有集群线缆连接错误的告警,请重复此步骤重新检查。
如果没有出现集群线缆连接错误的告警,请执行后面步骤3。
2、检查设备是否已经使能集群功能。
使用命令display css status查看两台交换机的集群状态。
如果显示信息中出现CSS Enable为Off,则交换机的集群功能未使能。使用命令css enable使能设备的集群功能,并重启设备。
如果显示信息中出现CSS Enable为On,表示交换机已使能集群功能。请执行后面步骤3。
3、检查集群卡的工作状态。
更换集群卡时建议将主控板拔出更换,请勿带电拔插集群卡。
若设备已经使能集群功能、集群ID配置正确、集群线缆连接正确的情况下,仍然无法建立集群系统,则需要检查集群卡的工作状态。集群卡的指示灯含义及故障处理方法如下表1所示。
4、如果执行以上步骤后故障依然存在,请收集以下信息,并联系技术支持工程师。
上述步骤的执行结果。
设备的配置文件、日志信息、告警信息。