IBM服务器阵列卡损坏N种情况的解决的方法

更新时间:2023-09-24 20:27:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

IBM服务器更换阵列卡的方法

关于IBM 服务器更换阵列卡的方法

随着时间的推移,越来越多的IBM服务器陆续过保了,许多的蓝色快车服务站也开始维修过保的服务器,但是,很多有实践经验的工程师(包括去IBM作专职)逐渐离开蓝快,后面来的工程师基本上不清楚以前的服务器,更换主板、电源、CPU、MEM,还可以作,但服务器上最重要的是RAID卡上存了一份阵列信息,硬盘上也会保存一份阵列信息。如果工程师更换RIAD卡或硬盘时操作不当或大脑思路不清淅,很容易造成客户的数据的丢失。我作了多年的工程师,几乎每一种IBM服务器我均搞过,将一些更换阵列卡的方法以及注意的问题等,实践过的经验方法共享给各位,也欢迎各位朋友同事提出宝贵的意见和建议。 (一) RAID卡的分类

1、 3L、3H(80M属第三代RAID卡)

2、 4L、4LX、4M、4MX、4H(U160属于第四代) 3、 5I卡(第五代) 4、 6I、6M(第六代)

5、 7K、7T、7I(第七代) 6、 8I(第八代)

(二) 举例:第四代RAID卡,4L、4LX、4M、4MX、4H在7600/X250服务器上更换方法。 备件1、4H FRU 37L6892,母卡;子卡,FRU 37L6902;

备件2、三个硬盘18GU160 10K 80P FRU 19K1467在7600/X250服务器上安装,4H卡,SCSI线接第一个SCSI通道,即CHANNEL 1(阵列卡上有标识),三个硬盘分别上在SCSI硬盘背板通道ID0、ID2、ID3上,开机后,第二屏会自检到4H卡和三个硬盘。

(三) 如何判断4L 4LX 4H 4M 4MX RAID 卡坏了:

1.服务器根本认不到RAID 卡 更换一个PCI 槽也是一样的。

2.开机检测试 RAID 卡上有5个灯 如果不是连续的闪跃过 只有一个灯亮,或者5个灯全部常 亮 RAID 卡必然坏了。

3. 开机可以检测到RAID 卡,但是RAID 卡报代码的错误,

按 Ctrl+I 可以进入RAID卡BIOS,作Restare to Factory Defanlt Settings (恢复原 设置,即清除RAID卡上的阵列信息) 后还是报代码错误 也是必然的RAID 坏。

4. RAID卡 插到服务器上,服务器开机就没有显示了,拔掉RAID卡,服务器就有显示了,RAID 卡 必然是坏的。

5. RAID卡 配完RAID 后 ,装系统死机(排除OEM的MEM 光盘 OEM 硬盘的问题) 也可以说明 RAID卡坏,不过这种情况不是很明显的,很少呢能碰到,我只遇到一次。

6. 就是蓝快备件库里返修过的RAID 卡,有时可以认到,有时不认,RAID卡有飞线的,实际上 也是坏的,要投诉蓝快的领导可以换到好的。

7. 特别说明目前IBM的4MX卡(双通道的,RAID卡上有个散热片的),这种RAID卡,特别容 易坏,过3年保修期几乎是各个都坏。这主要是IBM设计上问题。相反4M 4LX 4H就很少坏。 8. 一个重要的要点:4MX 卡在X250/X255/X235 坏的特别的多,你仔细看 这种服务器的PCI槽

都有红色的卡位 4MX 卡在蓝色的卡位反而坏的少。

下面是检测查看RAID 卡上的情况:(以及功能菜单选项的作用)

IBM服务器开机后第二屏显示:当检测到RAID卡时:

IBM Serve RAID BIOS XXXX 1994 2001 ……….

BIOS Version 4.84 (这是RAID卡的BIOS版本号)

Controlier 1 slot 3 Logical drivel firnware4.84. 01=ok

《press ctrl+I to access the mini-configuration program 此时:按 Ctrl+I 可以进入RAID卡BIOS

IBM Serve RAID Mini—Configuration Program ver4.84 01 Main memu

View cantroller status (显示RAID卡及硬盘状态) View configuration

Advanced functions(高级设置) EXIT

进入View Controller status(选择这一项回车进入)

Status for controller(4H卡) 此时可以看到有4个通道 通道1上有硬盘3个没有没RAID

CH1 CH2 CH3 CH4 Array Array ……………………. SID SID SID SID 0 RED (没有作RAID状态) 1 RED 2 RED 3 RED

7 INI (SCSI卡上的通道ID)

8 9

15 DRC(终结)

Advanced Functions (进入高级设置)

Restare to Factory Defanlt Settings (恢复原设置,即清除RAID卡上的阵列信息)

Copy the configuration from drives to the controlle (从硬盘上拷贝阵列信息到RAID卡上)、这是更换RAID卡重要的步骤,这一步作好才可以恢复RAID卡与硬盘之间的阵列信息的链接,系统才可以启动。

View controller and PCI informatim (显示RAID卡的信息) Controller information

Controller Type Serve RAID 4H(可以看出是4H卡) Partmumber 06p5792

下面是配阵列的方法:

4.84Serverraid光盘启动后进入程序配置阵列 Managed Systems

Localhost(Local System)

Conroller 1 鼠标右键 Hlints and tips Restroe to factory-defanlt setting Arrays 鼠标右键 Copy configuration from drives Logical drives delete all arrays Hot-spare drives Physical drives

Arrays (鼠标右键) Hintsard tips

Configure RAID鼠标右键 进行配置阵列,可作RAID 1,RAID 5+Hot-Spare 配完阵列后在SCSI上看到硬盘为ONLINE 状态 表示配好了,可以启动装系统 SCSI Physical drives channel 1 IDO –online (17357MB) ID2 – online( 17357MB) ID3 – online( 17357MB) ID15 – online( 17357MB) SCSI channel 2

此时就表示IBM 的RAID 已经配好了 可以安装系统了 作RAID5 呢 后台继续作RAID的同步重新启动可以安装系统。

下面分几种情况更换RAID卡(4H卡坏,用相同的4H来更换) 也就是说相同的卡去换相同一样的卡 这个工作难度不大。

(一) 情况一:(已经配好了RAID并且有重要的数据的前提下)

(1) 只是RAID卡坏,硬盘没有坏,作为客户千万不能乱动硬盘,或将硬盘的ID顺序搞乱,不能更换硬盘的位置,否则死路一条。

(2) 换RAID卡之前,要搞清楚原来RAID卡4H的BIOS VERSION版本号(一般是4.84或5.11或6.11)

(3) 换上去的RAID卡4H(要和原来坏的RAID卡4H BIOS 4.84的BIOS 4.84要一致,否则启动系统只是蓝屏,Driver不对)。

(4) 更换RAID 4H卡时,要看清楚4H的SCSI线接在哪个通道上,要关闭所有电源下进行,同时,要注意灰尘,将PCI槽上或主板上的灰清除干净,否则会烧掉新装的RAID卡,或RAID卡短路,也可以换一个PCI槽上新的RAID卡,这没有什么影响的。 (5) 作好一切准备工作后,将RAID卡4H装好,开电源,开机。 会看到如下信息:(其中之一) IBM Serve RAID BIOS

BIOS Version:4.84.0.1

Controller 1 slot 3,Drive Logical drivel firnware4.84. 01=ok

会看到:

3个新硬盘被发现

按CTRL+I进入

Copy the configuration from drives to the controller (选择这项) 可以将硬盘之中的RAID信息写入RAID卡上,同步后,起动系统,OK 也可以用SERVE RAID 光盘4。84启动,

选择copy the configuration from drives the coneroller

(二) 情况二:(前提条件主板电源系统均好的)

4H卡也坏,有一个18G硬盘也坏,同时坏了两个与数据有关的关键性的配件。

这个硬盘如果是在RAID之中(CTRL+I可以看到DDD,不一定说明就是坏的,只能说是掉线,是否真正坏,可以SCSI线从RAID的通道上,接回到主板的SCSI口上,CTRL+A进入后,再扫描检测,如果红底白字则有坏道。

下面有两种情况:(前提条件是先不要动那个确定坏的硬盘,先去更换4H阵列卡坏的那个硬盘也千万不要从服务器或EXP200EXP300中拔出来,因为硬上还有阵列信息的链接) 1.如果只是有一个硬盘坏 RAID卡没坏情况如下: 2.如果重新更换4H 卡,连好线后,情况如下:

IBM Serve RAID BIOS

Xxxx 1994 2001 xxxx BIOS Version:4.84.0.1

WARNING 1 online drives defunct ( 表示有一个硬盘不在线了,出问题了)

Controller 1 slot 3 logical Firmware 4.84.0.1=ok

Press ctrl+I to access the mini Configuration Pregram

还有一种情况:

如果4HRAID卡坏,重新更换4H 卡,连好线后,情况如下: IBM SERVE RAID BIOS

Copyright IBM Corp 1994 2001 ALL BIOS Version 4.84 01

Controller 1 Slot 3,Logical drive=0,firmware=4.84.01 status=fail Drive(s) not responding orfoumd at new 1 ocation(s)

Standby device(s) mot responding or found at new location(s) Press F2 betaied information F4 Retry the cornmand

F5 change the corfiguration and set the drive(s) defunct F10 Continue wit bout changing the configuration

此时说明需要改变原来的RAID卡的信息。但硬盘上的阵列信息还在。

按F5 XXXXXXXXXX

XXXXXXXX OK

Controller 1 slot3 logical drivel firmware 4.84.01=ok Press ctrl+I to access the mini-configuratian pregram

以下两种方法从硬盘恢复阵列信息到 4H阵列卡上:(即原来的4H卡坏,用相同的4H 卡来更换)

方法(一)PRESS CTRL+I进入后

copy the configuration from drives to the controlles

方法(二)4.84SERVE RAID 光盘启动

Controller 1 (not configured) 鼠标右键 Copy the configuration from drives to the controller (选择这项)

Physical drives SCSI channel 1

IDO –Ready(17357MB) ID2 –Ready(17357MB)

ID3 –Ready(17357MB) 这是没有恢复阵列链接的硬盘状态 看不出来有硬盘坏

鼠标右键 Copy the configuration from drives to the controller 后

会出现一个警告 (不要害怕这是正常的提示:)

本文来源:https://www.bwwdw.com/article/hbsd.html

Top