传输专业设备故障处理指导手册

更新时间:2024-03-01 03:13:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

传输专业设备故障处理指导手册

1

1.0编制目的

为了提高辽宁公司传输专业维护人员对传输设备告警处理的能力、快速定位告警原因、缩短故障处理时长、提高故障处理效率,根据集团网运部关于北方NOC标准化建设的总体要求,以及辽宁省公司公司网运部关于告警处理的各项管理规定,结合实际情况,形成本处理手册。

2.0适用范围

本手册适用于地市所有波分、SDH等传输设备。

3.0传输告警分级分类及派单规则

3.1 告警分级分类

3.1.1告警分级

告警级别用于标识一条告警的严重程度和重要性、紧迫性,按严重程度递减的顺序可以将告警分为以下四种:紧急告警、重要告警、次要告警、提示告警。

告警级别 紧急告警 重要告警 次要告警 提示告警 定义 带有全局性的、会导致主机瘫痪的故障告警和事件告警。 局部范围内的单板或线路故障告警和事件告警。 一般性的、描述各单板或线路工作是否正常工作的故障告警和事件告警,如单板复位、公用资源申请失败/占用超时等。 提示性故障告警和事件告警。 3.1.2 告警分类

告警类别 定义 举例

2

通信告警 处理告警 设备告警 服务告警 环境告警 安全告警 有关网元通信、ECC通信、光信号通信网元通信中断、光信号丢失。 等的告警。 数据库错误、网元处于安装有关软件处理和异常情况的告警。 态。 有关设备硬件的告警。 激光器故障、光口环回。 有关业务状态和网络服务质量的告警。 线路层信号劣化。 有关电源系统、机房环境的告警。 电源模块温度过高。 有关网管、网元安全性的告警。 网元用户未登录。 4.0告警处理基础知识

4.1 SDH单板常见告警详解

4.1.1 摘要

SDH帧结构中有着丰富的开销字节,借助于这些开销字节传递的告警、性能信息,使得SDH 系统具有很强的在线告警和误码监测能力。本段落从数据流向的角度,与单板相结合,详细阐述了各个单板可能出现的告警信息与原因,对维护人员了解告警信息的产生方式与对故障的快速定位有一定帮助意义。 4.1.2线路告警

指信号流向为SDH 接口→交叉板→SDH 接口这条路由上的告警信息,也就是在光板上出现的告警。有再生段、复用段与高阶通道开销告警。具体为: (1)

LOS信号丢失(截止)

从光路上来的STM-N 光信号进入光板的光接收模块后,首先经过光电转换后,被恢复成公司号送往帧同步器和扰码器处理。在这过程中,光电转换模块会对该信号进行检测,如果发现输入信号无光、光功率过低

3

或光功率过高以及输入信号码型不匹配时会上报LOS(信号丢失)告警。发生R-LOS 告警时,系统会对下一级电路插入全“1”信号。 (2)

OOF帧失步报警与LOF帧丢失告警(截止):

A1、A2 字节用来定位从光/电转换模块发来的STM-N 信号,同时从中提取线路参考同步定时源,发送给时钟板进行时钟锁定,正常情况下,A1 值恒为F6,A2 值恒为28,但如果检测到A1≠F6 或A2≠28,将上报OOF 告警(帧失步报警)。如果R-OOF 告警持续超过3ms,则上报帧丢失告警LOF 并下插全\信号。在LOF 状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。 (3)

J0 追踪识别符失配告警:

定帧后检查J0字节,如果收发两端的J0 字节不匹配,则会上告J0 追踪识别符失配告警。 (4)

B1 误码:

如果从STM-N 信号中恢复出的B1 字节和接收到的前一个STM-N 帧中的BIP-8 计算结果不一致,则上报B1 误码。

以上部分为再生段告警信息。下面介绍复用段告警。这部分主要处理的与告警、性能相关的再生段开销字节有:自动保护倒换通路字节(K1、K2)、复用段误码监视字节(B2)。 (5)

MS-AIS ,MS-RDI告警:

如果检测到K2(b6-b8)=111,则上报MS-AIS 告警并下插全\信号。如果检测到K2(b6-b8)=110,则上报MS-RDI 告警。

4

(6) B2 误码:

如果从STM-N 信号中恢复出的B2 字节和前一个STM-N 帧(除再生段开销外的所有比特)的BIP-24 计算结果不一致,则上报B2 误码。并通过M1字节上报MS-REI告警(注意此告警为回传的告警信息)。 下面讲述指针与高阶通道开销告警。这部分主要处理的是高阶指针调整和高阶通道开销,与指针调整有关的字节是H1、H2、H3,而与告警、误码相关的字节有高阶通道追踪字节(J1)、信号标记字节(C2)、高阶通道误码监视字节(B3)、通道状态字节(G1)、复帧位臵指示字节(H4)。(注:有的系统高阶通道开销在支路板上处理) (7)

AU-AIS管理单元-告警指示信号

H1 和H2 字节全为“1”,则上报AU-AIS 告警并下插全“1”信号。 (8)

AU-LOP(管理单元-指针丢失)

如果H1 和H2 字节代表的指针值非法(不在正常范围0~782 内),连续8 帧收到非法指针,则上报告警并下插全“1”信号。处理了指针后,光板对高阶通道开销进行处理并产生相应的告警信息。 (9)

HP-TIM(高阶通道踪迹字节失配):

J1 字节和预定值不同,则上报HP-TIM 告警并下插全“1”信号。 (10) 高阶通道未装载,高阶通道信号标记失配:

如果检测到字节C2=00,则上报HP-UNEQ(高阶通道未装载)告警并下插全\信号。如果检测到C2 字节和预定值不同,则上报HP-SLM(高阶通道信号标记失配)告警并下插全\信号。

5

(11) B3 误码:

如果从HPOH 恢复出的B3 字节的计算结果和前一帧VC-4 信号的BIP-8 计算,结果不一致,则上报B3 误码。 (12) HP-RDI与HP-REI:

如果检测到字节G1(bit5)=1,则上报HP-RDI 告警,根据字节G1(bit1-bit4)的取值是否为1-8,判断是否上报HP-REI 告警,若是,则上报。

(13) LOM(复帧丢失)告警

如果检测到H4 字节非法,则上报LOM(复帧丢失)告警,并下插全\信号。 4.1.3 支路告警

支路告警主要考虑低阶通道开销告警。业务流向为支路板→交叉板→光板,从交叉板来的VC-4 信号送到支路板,然后把VC-4 解映射成VC-12。 (1)

HP-LOM告警:

如果检测到H4 复帧字节序列错,则上报HP-LOM。(和13相同) (2)

TU-AIS 、TU-LOP 、LP-RDI告警:

如果检测到低阶指针字节V1、V2 值为全“1”,则上报TU-AIS 告警;如果检测到V1、V2 值为不合法,则上报TU-LOP 告警,发生这两个告警都会往下一功能块插入全“1”信号。

此外,如果接收到TU-AIS,除在向下的数据中插入AIS 信号以外,同时需要回告LP-RDI,即将V5 字节字节的b8 比特臵为“1”。

6

(3) 低阶通道未装载LP-UNEQ、信号标记失配LP-SLM:

检测V5 字节的b5-b7 比特,作为信号标记上报。如果为000,则表示低阶通道未装载LP-UNEQ,并往下一级电路插入AIS 信号。如果信号标记失配,则上报LP-SLM,并往下一级电路插入AIS 信号。在V5 字节的b8 中通道RDI 信息将被终结,并上报“远端告警指示”。 (4)

LPBBE、LPFEBBE:

检测V5 字节的误码监测比特位b1、b2,对VC-12 计算BIP-2。对现行帧计算出来的BIP-2 值将与下一帧中恢复出来的V5 的b1、b2 进行比较,不一致则上报LPBBE。同时,V5 字节中的b3 比特被恢复出来,如果为“1”,表示检测到远端有BIP-2 差错,作为LPFEBBE 上报。 (5)

低阶通道追踪识别符失配告警(LP-TIM):

检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。与此同时,还会将低阶通道识别符J2 字节恢复出来,并检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。

4.2 波分系统信号流及常见告警

4.2.1 波分系统信号流

波分复用系统设备可分为光终端复用器(OTM)、光线路放大器(OLA)、光分插复用器(OADM)和电中继器(REG)几种类型。 以OTM系统为例,业务信号在系统里的流向如图所示:

7

图1 发送端

图2 接收端

4.2.2 波分系统常见告警 光波长转换单元(OTU)常见告警

告警描述 各厂家告警描述 缺省告警级别 烽火:R_LOS、TRIB_RF; 1、线路光纤断;2、线路紧急 华为:R_LOS 衰耗过大;3、对端站发送中兴:信号丢失告警 部分故障,线路发送失效 烽火:RS_LOF、紧急 1)输入光功率过低或传输OTN_SDH_LOF; 过程误码过大 2)对端站华为:LOF 点发送部分故障 中兴:帧丢失告警 产生告警的主要原因 信号丢失 帧丢失

8

激光器发送失效 发送器劣化 输入功率过低 输入功率过高 单板不在位告警 烽火:OTN_LDOFF、CLIENT_LDOFF; 华为:TF 中兴:输出无光告警 烽火:EOL 华为:TF 中兴:激光器寿命告警 烽火: IOP、; 华为:IN_PWR_LOW 中兴:输入弱光告警 烽火: IOP_HIGH、 华为:IN_PWR_HIGH 中兴:输入光功率过强告警 烽火:CARD_ABSENT、COMFAIL; 华为:BD_STATUS 中兴:接口板不在位、单板脱位 紧急 本板激光器故障 紧急 激光器性能变坏 重要 输入光功率过低 重要 输入光功率过高 重要 子架板位槽无单板、单板邮箱故障或单板未插好 波分复用器:分波/合波器(ODU/OMU)常见告警:

告警描述 单波长信号丢失 各厂家告警描述 烽火:CH_ILOS 华为:MUT_LOS 中兴:OPM板某个具体通道上报“输入无光告警” 产生告警的主要原因 缺省告警级别 1)输出光功率检测电紧急 路故障 2)线路衰耗过大 光放大器(BA/LA/PA)常见告警:

告警描述 各厂家告警描述 产生告警的主要原缺省告警级因 别 重要 输入光功率过低 输出光功率大雨上重要 限;本盘故障;或门限设置不当 紧急 本板激光器故障 烽火:IOP; 输入功率过低 华为:IN_PWR_LOW 中兴:输入弱光告警 烽火:OPM、 输入功率过高 华为:IN_PWR_HIGH 中兴:输出强光告警 烽火:LASER_TF、PUMP_TF 激光器发送失效 华为:TF 中兴:输出无光告警 光监控信道/通路(OSC)常见告警:

9

告警描述 各厂家告警描述 产生告警的主要原因 缺省告警级别 烽火:OSC_LOS 接收线路侧信华为:R_LOS 号丢失 中兴:输入无光告警 烽火:OSC_FERF 接收远端告警 华为:OSC_RDI 中兴:信号丢失告警 1)断纤2)线路衰耗过大紧急 3)对端站发送部分故障 对端站接收到告警信号 次要 5.0告警处理

5.1 SDH设备告警处理

华为SDH设备告警操作手册:

序号 1 网管告警现象 R-LOS 产生原因 处理办法 光路断或用户端设备先确认用户端设备是否掉电,是掉电或故障 否为市电断电导致,如均不是,则查询全程光路是否有问题,设备是否存在问题 在哪个机房产生,则故只需确认相应端局是否有人正在障点即在哪个机房 施工或做相关操作,否则由相关人员检查设备至配线架之间的整条路由中是否存在问题。 多数会由于对端站出多数情况下为非本端问题,是由现故障或配置数据不对端故障所引起,首先保证整条完全造成此告警 传输路由中没有其他告警,其次确认是否有相关人员正在进行配置数据等操作。 2 T-ALOS 3 TU-AIS 4 R-LOF、R-OOF 多数会伴随R-LOS产以处理R-LOS告警为先,否则检生,如果不是则有可能查光路质量是否良好 是光路衰耗过大所引起

10

5 PS 传输环网发生倒换 检查是否存在其他紧急告警,如有光路问题,以处理光路问题为主。 6 BD_STATUS 单板不在位 确认是否有人正在进行拔插单板或配置业务等操作,否则通知相关专业员处理 除上述告警外不常出现的告警,先咨询专业员,在决定是否通知包机责任人。 5.2 波分设备告警处理

波分设备告警处理时,大体需要把握以下三点:

1) 应严格区分告警来源究竟是客户侧还是波分侧,区别方法总结如下:

客户侧(接收线路侧) 波分侧(群路侧) 烽火 线路2 IN/OUT 线路1 Rx/Tx 中兴 OAC侧 OCH侧 华为 CLIENT Rx/Tx OCH IN/OUT 2) 关于激光器自动关断功能:激光器自动关断是在没有光输入的时候,自动关断输出,主要作用是延长激光器寿命,起保护作用。在网运行的设备,只有华为的设备启动了这一功能,即光放站或是OTM站的光放大板如果收不到上游站的光,则该站点不向下游站发光。 3) 性能事件分析:性能事件是反映设备工作性能的重要参数。性能事件和告警是相关的,当性能事件值超过预先设定的门限时,就会引发相关的告警。了解和掌握性能事件的产生原理、相关单板和相关告警,有利于在日常维护中及时发现隐患,有利于在发生故障时进行故障分析。非传输专业人员只要求会打开性能事件窗口,将当前

11

15分钟性能与历史性能对比即可。 5.2.1 LOS告警

LOS告警含义为输入光功率低于预定门限值,即输入信号丢失。 1) 波长转换板上的LOS告警:

OTU(波长转换板)上的客户侧LOS告警上报因厂家而异,客户侧LOS告警总结如下:

LOS告警 中兴 输入无光告警; 信号丢失告警 华为 R_LOS 烽火 TRIB_RF(支路侧收无光) OTU很少上报群路侧LOS告警,因为群路侧为设备内部连纤,出现告警的概率很低。

处理方法:准确定位告警单板,以及告警来源(客户侧还是群路侧),查看告警单板是否故障,光路是否正常,然后根据故障原因进行相应处理。

2) 光放盘上的LOS告警:

光放盘上接收上游站的放大盘上报此告警,此时往往伴随光监控信道盘的LOS告警,出现这两个告警的原因多数是光缆故障。该告警往往会影响数据专业、交换专业的设备,查看传输网管的同时需注意其他专业监控终端的上报情况。

处理方法:首先查看告警单板是否故障,然后进行线路巡检,确定光缆断点后立即进行熔纤等抢修工作。 5.2.2 LOF告警

LOF告警含义为业务信号帧丢失,产生原因较多,例如接收光功率低、

12

传输误码过大、对端发送故障等等。由于该告警在群路侧和客户侧均会产生,而且整条电路路由上的网元均有可能上报该告警,因此定位该告警的故障点相对困难。 处理方法:

从电路的终端站开始查询,是否有客户侧LOS告警或客户侧LOF告警,如果有,则初步断定故障点在该终端站;如果没有相应告警,只有群路侧LOF告警,需根据电路的路由信息查看相关网元,直至找到故障点。 注意:烽火设备OTU板的FEC_FDI告警相当于群路侧帧丢失告警。 提示:背靠背的OTM站中,对应波道一端站的群路侧有帧丢失告警,另一端站则会有客户侧帧丢失告警。 5.2.3 输入光功率低、高告警

波分系统单板接收光功率低于门限值的下限或高于门限值的上限即会上报输入光功率低或高告警。

处理方法:查看故障单板的性能事件,将当前性能与历史性能和预臵值相对比。找到差异原因,对光功率值偏差过大以至于造成网络运行隐患的,需由传输专业员与设备厂家共同制定光功率整改方案。如果涉及到省干电路,需按相关要求进行割接申报,与省公司配合共同完成光功率隐患整治。

13

本文来源:https://www.bwwdw.com/article/szia.html

Top