华为网络交换机设备巡检手册
CONTENTS 目录
目录 第一章 第二章
2.1
华为网络交换机设备巡检项目 检查指导
3 4
环境巡检 ............................................................... 4 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8
机房环境 机房清洁度
设备电源及风扇检查 设备运行温度检查 设备供电系统检查 机柜内部环境检查 消防检查 防盗检查
4 4 5 5 5 5 6 6
2.2 2.3 2.4 2.5
设备基本信息检查 ....................................................... 6 设备运行状态检查 ....................................................... 7 端口检查 ............................................................... 8 业务模块运行检查 ....................................................... 8
第三章 第四章 第五章
网络拓扑巡检报告单 网络链路状况巡检单 网络设备巡检单-(防火墙)
11 12 13
第一章 3
第一章
一、环境巡检
华为网络交换机设备巡检项目
设备巡检项目包括以下9方面内容。
二、配置信息检查
三、运行状态检查:cpu,内存状态检查,网络端口状态检查,日志检查等 四、网络设备软件版本信息 五、设备持续运行时间 六、设备模块运行状态 七、设备风扇及电源状况 八、设备运行机箱温度 九、设备表面清洁
第二章 4
第二章
2.1
检查指导
环境巡检
2.1.1 机房环境
维护项目 温度状况 操作指导 观测机房内温度计指 示,并记录数据。 参考标准 在正常情况下,机房长期工作环境温度 应在 0°C ~ 45°C 之间,短期工作环 境温度应在-5°C ~ 55°C 之间。 若机房的环境温度长期不能满足要求, 维护人员应考虑检修或更换机房的空调 系统。 检查空调制冷度、开关情况等,空调制 冷应完好无损,开关接触良好。 湿度状况 观测机房内湿度计指 示,并记录数据。 在正常情况下,机房的长期工作环境相 对湿度应在 5% RH(Relative Humidity)~ 85% RH 之间,短期工作 环境相对湿度应在 0% RH ~ 95% RH 之间。 若机房的相对湿度过大,运营商应考虑 为机房安装除湿设备;若机房的相对湿 度过小,运营商应考虑为机房安装加湿 设备。
2.1.2 机房清洁度
维护项目 清洁状况 操作指导 观察机房内设备外壳、设 备内部、机架内各通风 口、地板、桌面。 参考标准 所有项目都应干净整洁无明显尘土附 着。 注意通风口的清洁状况,及时清洗, 以免影响机柜门及风扇框的通风、散 热。 设备正常工作时,要求保持风扇正常 运转(清理风扇期间除外),擅自关 闭风扇会引起设备温度升高,并可能 损坏单板。 不要在设备子架上通风口处放置杂 物,还应定期清理风扇的通风口。
散热状况 观察机房内设备的散热状 况。
第二章 5
2.1.3 设备电源及风扇检查
序号 检查项 检查方法 评估标准 重点关注单板在位信息及状态信息是否正常,当显示如下信息时表示为正常。 单板“Online”为“Present”。 1 单板运行状态 display device 单板“Power”为“PowerOn”。 单板“Register”为“Registered”。 单板“Status”为“Normal”。 2 3 风扇状态。 电源状态。 display fan display power Status为normal表示正常。 state项为supply时表示正常。 2.1.4 设备运行温度检查维护项目 设备温度 操作指导 参考标准 执行 display temperature 正常情况下,各模块当前的温度应 该slot slot-id 命令查看设备各 在上下限之间。 模块的温度,并记录数据。
2.1.5 设备供电系统检查
维护工程师观测并记录的电源模块的基本情况。 维护项目 操作指导 参考标准 电源备份情况 观察电源模块是否有备份 最好能够有备份电源,如果没有请记 在记录表中。 2.1.6 机柜内部环境检查
维护工程师观测并记录的机柜内部环境。 维护项目 线缆布放 操作指导 观察机柜内部线缆 的布放情况。 参考标准 电源线与业务线缆分开布放。 电源线布放整齐、有序。 业务线缆布放整齐、有序。 线缆标签清晰、准确,符合规范。 线缆标签 观察机柜内部线缆 标签情况。
第二章 6
机框外观 机框散热 观察机框是否完 整。 空闲槽位有假面板保护。 观察机框是否正常散热机框的进风口没有过多灰尘堵塞,不影响设备正常散热。进风情况。 框和电源面板应安装有防尘网,如果防尘网上灰 尘较多,需要及时清洗。 如果单板面板上有通风口、单板面板灰尘较多,应用
2.1.7 消防检查
维护项目 消防状况 操作指导 检查机柜、机框、电缆走 线槽等关键部位。 参考标准 所有部位均不存在火警隐患,且机房内 配备的各种消防设施均完好无损、无异 常。 2.1.8 防盗检查
维护项目 防盗状况
操作指导 检查机房的门、窗、防盗 网等设施。 参考标准 机房所有的门、窗、防盗网等设施均应 该完好、无损坏。 2.2 设备基本信息检查
维护工程师检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。
序号 1 检查项 设备运行的版本 检查方法 display version display startup display license 评估标准 单板PCB版本号、软件版本号与要求相符。 设备正在使用及下次启动时将要加载的产品版本软件和配置文件的文件名正确。 License文件已经激活,且“Expired date”为“PERMANENT”(即永久有效)或在运行截至日期之内。 补丁文件必须与实际要求一致,建议加载华为公司发4 检查补丁信息 display patch-information 布的该产品版本对应的最新的补丁文件。 补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。 5 检查系统时间 display clock 时间应与当地实际时间一致(时间差不大于5分钟),便于故障时通过时间精确定位。 2 检查软件包 3 License信息第二章 7
如果不合格,请执行clock datetime命令修改系统时间或者配置NTP同步网络时间。 dir cfcard: 6 CF卡中的文件 dir slave#cfcard: 7 检查配置正确性 display current-configuration display debugging compare configuration CFcard里的文件都必须是有用的,否则请执行delete/unreserved命令删除。 通过查看当前生效的配置参数,验证设备配置是否正确。 设备正常运行时debug开关应该全部关闭。 业务配置正常后,要进行保存。运行配置需要与保存过的配置相同。 8 检查debug开关 检查配置是否保存 92.3 设备运行状态检查
维护工程师检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。
序号 检查项 检查方法 评估标准 重点关注单板在位信息及状态信息是否正常,当显示如下信息时表示为正常。 1 单板运行状态 单板“Online”为“Present”。 display device 单板“Power”为“PowerOn”。 单板“Register”为“Registered”。 单板“Status”为“Normal”。 2 风扇状态。 电源状态。 主用板/4 备用板的备份状态。 5 FTP网络服务端口 display ftp-server display switchover state display fan Status为normal表示正常。 3 display power state项为supply时表示正常。 主备板同时存在时,要同时有主备板的显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。 不使用的FTP网络服务端口要关闭。 无告警信息。 6 告警信息 display alarm all 如果有告警,需要记录,对于严重以上告警需并立即分析并处理。 7 CPU状态 内存占用率 日志信息 display cpu-usage display memory-usage display logbuffer 各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。 内存占用情况正常,如果“Memory Using Percentage”超过60%时需要关注。 不存在异常信息。 8 9第二章 8
display trapbuffer2.4 端口检查
维护工程师检查设备的端口信息,如端口协商模式、端口配置、端口状态等是否正确。
序号 1 检查项 端口错包 检查方法 display interface 评估标准 业务运行时,要检查端口有无错包,包括CRC错包等。 端口协商模式正确,两边端口要一致,不能有半双工模式。 接口的配置项合理,如接口协商模式、速率、隔离、限速等。 端口的Up/Down状态满足规划要求。 正常情况下,两次的数据没有增长,且基数不大于500。 2 端口协商模式 display interface display current-configuration interface display interface brief 执行display ip interface 命令。分两次隔5分钟后收集数据,然后比较。 3 端口配置 4 端口状态 5 端口统计数据2.5 业务模块运行检查
维护工程师检查设备运行的业务是否正常并记录的设备各业务模块运行信息。
序号 检查项 组播成员接1 口和路由器接口信息 组播报文统计信息 检查方法 display igmp-snooping port-info 评估标准 静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。 VLAN接收/发送的IGMP报文和PIM Hello报文个数,以及所有VLAN内发生的二层事件次数统计合理。 2 display igmp-snooping statistics vlan 执行display l2-multicast forwarding-table命令查看二3 组播转发表信息 层组播转发表项。 执行display multicast forwarding-table命令查看三层组播转发表项。 组播转发表项正确。 4 组播路由协议 执行display multicast routing-table命令。 域内组播路由协议采用PIM-SM。 与组播相连的接口都必须要使能IGMP。第二章 9
DHCP 5 Snooping绑定表 6 MAC地址表信息 display dhcp snooping user-bind all display mac-address 静态表项和动态表项正确。 MAC地址表信息正确。 具有默认路由或者其他精确路由,便于故障时候可以远程定位。 7 路由表信息 display ip routing-table 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。 8 OSPF错包情况 执行display ospf error命令。分两次隔5分钟后收集数据,然后比较。 执行display vrrp命令。 执行display vrrp statistics“State”不为“Initialize”状态。 备份组中的设备的VRRP状态“State”不能同时为“Master”。 “Checksum errors”、“Version errors”和“Vrid errors”为零。 正常情况下,两次的数据没有增长。 9 VRRP状态 命令。 防攻击检测 执行display current-10 configuration |include car命令。 应该有防攻击的配置。 如果未配置,请使用car命令为设备配置防攻击功能。具体步骤请参见《S7700&S9700 智能&核心路由交换机配置指南-安全》中的“本机防攻击配置”。 指定端口和根端口的“STP State”为11 MSTP状态 执行display stp brief命令。 “FORWARDING”。 备份根端口的“STP State”为“DISCARDING”。 12 MST域配置信息 执行display stp region-configuration命令。 查看交换机上当前生效的MST域配置信息。 输出内容包括:域名、域的修订级别、VLAN与生成树实例的映射关系以及配置的摘要。 查看MSTP拓扑变化相关的统计信息。 如果设备拓扑变化次数递增,则可以确定网络存在震荡。 查看实例端口的TC/TCN报文收发计数。 13 MSTP拓扑变化 TC/TCN报文收发计数 执行display stp topology-change命令。 执行display stp tc-bpdu statistics命令。 执行display loop-detection命令。 执行display loop-14 LDT功能配置正常的情况下: “Following ports are block for loop”、“Following ports are shutdown for loop”下无端口,证明启动环路检测的VLAN中没有出15 LDT环路检测 detection [ interface{ interface-type interface-number |interface-name }] 现环路。 端口的“Status”为“Normal”,证明该端口所属的VLAN没有出现环路。第二章 10
OSPF邻居状态 IS-IS邻居状态 BGP邻居状态 执行display ospf peer命令。 执行display ospf peer last-nbr-down命令。 执行display isis peer 命令。 OSPF邻居状态: 邻居状态“State”为“Full”。 正常情况下,要求该邻居建立时间不应该小于一天。 16 执行display bgp peer命令。 正常情况下,没有邻居down掉。 执行display ip routing-table命令。与前一次记录的路由信息比较,检查是否由明显变化。 对于处于一个网络中同一层次的设备,如果运并可抽样对其中的路由项进行ping或者tracert操作。 行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。 执行display current-指定Router ID为Loopback口地址。 如未分配Loopback口地址,则要指定为上行口地址或其他Down掉概率最小接口的地址。 配置的Router ID必须与OSPF正在使用的Router ID一致。 尽量使用network发布路由,也可以通过import方式引入路由。 正常情况下,路由表中有默认路由。 IS-IS邻居状态: 邻居状态“State”为“Up”。 BGP邻居状态: 邻居状态“State”为“Established”。 17 路由信息 18 OSPF Router ID configuration configuration ospf或者display router id命令。 执行display current-configuration configuration ospf命令。 执行display ospf vlink命令。 执行display current-19 OSPF路由引入配置 20 OSPF虚连接 不允许使用虚连接。 21 OSPF STUB区域 configuration configuration STUB区域,不能有import-route命令。 ospf命令。 除了VPN路由,禁止采用import-route命令发执行display current-布IP路由。 应使用network命令和ip route-static ip-22 BGP路由发布 configuration configuration bgp命令。 address { mask | mask-length } null0命令手工聚合路由后再静态发布。 执行display current-23 IBGP邻居 configuration configuration bgp命令。 ISIS 路由引入 执行display current-configuration configuration isis命令。
基于协议稳定性的考虑,建议使用Loopback这类状态总为UP的接口建立邻居关系。 24 尽量使用network-entity发布路由,也可以通过import方式引入路由。 第三章 11
25 VLAN信息 执行display vlan命令。 查看所有VLAN的基本信息。
第三章
巡检记录 网络拓扑图 网络拓扑巡检报告单
此处粘贴网络拓扑图 网 络 巡 检 报 告 网络拓扑分析: 网络拓扑分析建议: 此处可写对网络环境拓扑的建议
第四章 12
第四章
巡检记录 网络链路状况巡检单
服务项目 专线类型 服务内容 □DDN □E1 ■光纤 □ADSL □公司广域网连接 (以太网连至机房) □2M □4M □10M ■20M □其它 网络带宽 网络链路联通性状态: 网 络 巡 检 报 告 巡检提示
第五章 13
第五章 网络设备巡检单-(防火墙)
巡检记录: 设备型号: 设备作用描述: 设备基本信息 设备品牌 设备名称 管理地址 软件版本 设备 信息 端口数量 基本配置 CPU利用率 日志信息 连通性 内存利用率 序 列 号 设备型号 内存大小 放置位置 端口状态 ■正常 □故障 □VLAN ■Trunk ■STP 网 络 巡 检 报 告 ■正常 □故障 故障描述: 巡检提示