现在x86服务器里面的RAID卡(RAID Controller,或称RAID控制器),主流厂商基本上都是使用Broadcom(Avago/LSI)的OEM产品。
笔者:国际认证信息系统审计师、软考系统分析师
对RAID卡的管理操作,可以通过服务器BIOS、通过服务器带外(out-of-band)管理界面、RAID卡本身的固件界面以及运行在操作系统中的RAID卡软件进行。
但这些方法中,最关键的还是运行在操作系统中的RAID卡软件,因为这个方式不需要重启服务器,可以通过“热操作”方式实现大部分RAID配置操作。
如果是在Windows服务器操作系统中,可以使用DELL的OpenManage,或者直接使用控制器原厂的MegaRAID Storage Manager,这些都是GUI软件,可以比较方便直观地操作。
但如果操作系统环境是 Linux 命令行或者 Windows Core 命令行模式,没有图形界面,那就需要用到StoreCLI了。StoreCLI是MegaRAID Storage Manager的命令行方式。
下文以一台 DELL PowerEdge R640 服务器为例。这台服务器运行的是CentOS 7,通过lspci命令可以发现使用的是OEM版本的Broadcom / LSI MegaRAID SAS-3 3108(OEM后命名为 Dell PERC H730P Mini):
# lspci -k
1a:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS-3 3108 [Invader] (rev 02)
Subsystem: Dell PERC H730P Mini
Kernel driver in use: megaraid_sas
Kernel modules: megaraid_sas
由于DELL OEM的原因,需要在DELL的支持网站,对该服务器的“驱动程序和下载”栏目下,操作系统选择Redhat Enterprise Linux 7,类别选择SAS RAID,筛选后可以见到“适用于所有戴尔 HBA/PERC 控制器的 LINUX PERCCLI 实用程序”(或者旧一点的“PERCCLI Utility For All PERC9 Controllers”),按最新的下载得到PERCCLI_7.1623.00_A11_Linux.tar.gz文件。
如果是单独销售的RAID卡,或者其它一些没有专门定制过的服务器厂商,则可以在博通的网站“Support Documents and Downloads(https://www.broadcom.com/support/download-search)”下面可以选择产品家族为“RAID Controller Cards”进行查找,对搜索结果展开“Management Software and Tools”便可看到MegaRAID Storage Manager和 Latest StorCLI的下载。
把压缩包复制到服务器上解压,
# tar zxf PERCCLI_7.1623.00_A11_Linux.tar.gz
安装其中的rpm包:
# rpm -ivh perccli-007.1623.0000.0000-1.noarch.rpm
警告:perccli-007.1623.0000.0000-1.noarch.rpm: 头V3 RSA/SHA256 Signature, 密钥 ID cb529165: NOKEY
准备中... ################################# [100%]
正在升级/安装...
1:perccli-007.1623.0000.0000-1 ################################# [100%]
安装结束后,执行命令将被安装为:
/opt/MegaRAID/perccli/perccli64
如果是Broadcom通用版本,则是:
/opt/MegaRAID/storcli/storcli64
为方便使用,可以在PATH路径目录下创建符号链接:
# ln -s /opt/MegaRAID/perccli/perccli64/usr/bin/perccli
如果是通用版本:
# ln -s /opt/MegaRAID/storcli/storcli64 /usr/bin/storcli
下文一律按Dell的。尝试运行,会给出如下的提示信息:
# perccli show all
CLI Version = 007.1623.0000.0000 May 17, 2021
Operating system = Linux 3.10.0-1160.53.1.el7.x86_64
Status Code = 0
Status = Success
Description = None
Number of Controllers = 1
Host Name = localhost.localdomain
Operating System = Linux 3.10.0-1160.53.1.el7.x86_64
StoreLib IT Version = 07.1700.0200.0500
StoreLib IR3 Version = 16.14-0
System Overview :
===============
-------------------------------------------------------------------------
Ctl Model Ports PDs DGs DNOpt VDs VNOpt BBU sPR DS EHS ASOs Hlth
-------------------------------------------------------------------------
0 PERCH730PMini 8 2 1 0 1 0 Opt On 3 N 0 Opt
-------------------------------------------------------------------------
Ctl=Controller Index|DGs=Drive groups|VDs=Virtual drives|Fld=Failed
PDs=Physical drives|DNOpt=Array NotOptimal|VNOpt=VD NotOptimal|Opt=Optimal
Msng=Missing|Dgd=Degraded|NdAtn=Need Attention|Unkwn=Unknown
sPR=Scheduled Patrol Read|DS=DimmerSwitch|EHS=Emergency Spare Drive
Y=Yes|N=No|ASOs=Advanced Software Options|BBU=Battery backup unit/CV
Hlth=Health|Safe=Safe-mode boot|CertProv-Certificate Provision mode
Chrg=Charging | MsngCbl=Cable Failure
ASO :
===
----
Ctl
----
0
----
Ctl=Controller Index|Cl=Cluster|MD=Max Disks|WC=Wide Cache|SS=Safe Store|FP=Fast Path
Re=Recovery|CR=CacheCade(Read)|RF=Reduced Feature Set|CO=Cache Offload
CW=CacheCade(Read/Write)|X=Not Available/Not Installed|U=Unlimited|T=Trial
|HA=High Availability |SSHA=Single server High Availability
可见,给出了RAID卡的详细信息。
可以运行
perccli help
让程序给出完整的使用参数信息。
要良好使用这个工具,关键是要熟悉它对被管理对象的描述:
1/cx 指阵列卡控制器(controller)x,x为0开始的整数值,以下同。
2/vx 指虚拟盘(virtual disk)x,要基于阵列卡编号给出,即/cx/vx这样,以下类推。
3/vall 指全部虚拟盘。
4/ex 指盘柜(enclosure)x。盘柜是多个(常见是8个)物理盘插槽的整体。要基于阵列卡编号给出,比如/cx/ex。
5/eall 指全部盘柜,需要基于阵列卡编号。
6/fx 指外来配置(foreign configuration)x,基于阵列卡编号。
7/fall 指全部外来配置。
8/sx 指盘槽(slot)x,基于阵列卡编号和盘柜编号,其中盘柜编号可以省略,即/cx/sx。如果给出盘柜编号,则需要是/cx/ex/sx这样的顺序。
9/sall 指全部盘槽。
10/dx 指盘组(drive group)x。基于阵列卡编号。
11/dall 指全部盘组。
一些常用命令说明如下:
1storcli show all 显示RAID卡相关信息、RAID卡高级软件信息
2storcli64 /cx show all 显示某一块RAID卡的版本、功能、状态、以及RAID卡下的物理盘、逻辑盘信息。(注意/cx的x是RAID卡的编号,以下同理)
3storcli64 /cx show freespace 显示剩下的盘空间
4storcli64 /cx set rebuildrate=x1 整数,设置重建性能配比
5storcli64 /cx show rebuildrate 显示重建性能配比
6storcli64 /cx set patrolread=on or off 开启或关闭巡读检查
7storcli64 /cx set cc=on or off 开启或关闭一致性检查
8storcli64 /cx download file=filepath 升级RAID卡固件,需要重启
9storcli64 /cx flushcache 清除RAID卡和物理盘的缓冲
10storcli64 /cx/eall/sall show 显示物理盘(槽)信息
11storcli64 /cx/eall/sall show all 显示详细物理盘(槽)信息
12storcli64 /cx/ex/sx set good/offline/online/missing 设置某块物理盘(槽)的状态(注意/sx的x是盘的编号,以下同理)
13storcli64 /cx/ex/sx start locate 定位某个盘槽(闪灯)
14storcli64 /cx/ex/sx stop locate 停止盘槽定位
15storcli64 /cx/ex/sx show rebuild 查看阵列重建情况
16storcli64 /cx/ex/sx start rebuild 开始阵列重建
17storcli64 /cx/ex/sx stop rebuild 停止(暂停)阵列重建
18storcli64 /cx/ex/sx add hostsparedrive dgs=y 设置指定盘槽的物理盘为盘组y的热备盘
19storcli64 /cx/ex/sx delete hostsparedrive 取消指定盘槽的物理盘的热备设置
完整的参考手册在这里:
https://docs.broadcom.com/doc/12352476
本站微信订阅号:
本页网址二维码: