Live Volume with Auto-Failover (LVAFO)是Dell SC系列存储内置的解决方案功效,艰深的讲便是两套SC系列存储树立同步复制的卷能够同时被前端主机进行读写访问,并且还可以或者实现存储级其余自动故障转移,从而实现存储的“双活”。
两台存储上的Live volume卷将使用雷同的设备ID,当主机扫描到备存储上的卷时,没有会将那个卷当作一个新的设备,而是主机上的卷装备衔接多了多少条路径。
以一个500GB卷为例,在已将备存储上的LV卷映射给主机前,主机上看到2条到主存储LV卷的路径。
[root@ljjr910-a ~]# multipath -ll
mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready running
`- 3:0:17:2 sde 8:64 active ready running
映照备存储上的卷后,主机上看到一共看到4条路径,个中2条是到主存储的路径,2条是到备存储的路径。
[root@ljjr910-a ~]# multipath -ll
mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready
running <-到主存储的路径
|- 3:0:17:2 sde 8:64 active ready
running <-到主存储的路径
|- 3:0:13:2 sdg 8:96 active ready
running <-到备存储的路径
`- 3:0:19:2 sdi 8:128 active ready
running <-到备存储的门路
关闭主存储后,主机上就只能看到到备存储的2条路径。
[root@ljjr910-a ~]# multipath -ll
mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:13:2 sdg 8:96 active ready running
`- 3:0:19:2 sdi 8:128 active ready running
LV with AFO若何实现
Live Volume with Auto-Failover的实现重要有两个要害点,一是两套SC存储外部LV卷皆使用与主卷创建时相同的设备ID,发布是经由过程主机上的多路径在完成对设备的启拆后,酿成一个卷,这个卷同时有到主存储和备存储的路径。一旦主存储出现不测(如断电致使全部存储弗成用),主机上的IO只是产生路径的切换,整个切换过程运用不会中断,保障业务的连气女运行。
LV with AFO 可靠么
检修计划是否是靠得住,咱们以现实谈话,Dell部署办事团屡次以实战去测验过,实在的“双活”是不怕测的。
如下是一个比较完全的具备Windows、VMware、Linux平台应用都有的存储双活典范案例。
1
VMware vSphere情况实战
在VMware主机层面,2台Dell PowerEdge 服务器部署 vSphere 6.0 U2 虚拟化平台,配置了集群并启用了HA功能,可以在一定程量上避免因为主机的硬件或软件故障引起的非规划停机和业务中断。在存储层面,Dell SC Storage Live Volume Auto-Failover (LVAFO) 提供的存储双活解决方案能避免因单套存储要素引起的服务中断,将2套存储的live volume卷同时映射给虚拟化散群内贪图的vSphere 服务器,DataStore地点卷存在如下多路径建设。
在DSM存储管理界面,封闭主存储,模仿主存储故障。
在DSM中检查live volume存储状态,可以看到LV卷的存储脚色自动毛病转移成功实现。
登录到虚拟化服务器,确认存储卷是不是能正常访问,业务系统实拟机是不是正常运行。
文明可以正常上传,虚构机可以正常运行,不会因为主存储的关机而招致IO结束。
2
Windows平台的Oracle RAC环境实战
2台Dell PowerEdge服务器装置windows 2012 R2 服务器草拟体系,经由过程将SC4020主备存储分别过去的磁盘经由过程ASM整开后部署Oracle Rac数据库,在必定水平上躲免由于主机的硬件或硬件故障引发的非打算停机和营业中断。在存储层面,Dell SC Storage Live Volume Auto-Failover (LVAF) 提供的存储双活处理圆案能防止果单套存储身分惹起的服务中止,将2套存储的live volume卷同时映射给2台Windows 2012服务器节点,存储卷多路径设置以下。
在每个RAC节面下,调剂ASM磁盘超时的参数asmhbeatiowait,应参数在Oracle11.2.0.4中默许是15秒,倡议修正为120秒。
登录到DSM管理界面,关闭主存储,模拟主存储故障。
正在DSM治理页里能够看到存储状况切换胜利。
登录到Windows服务器节点,可以看到存储卷另有两条路径在线。
主机层面卷可以正常辨认,在Oracle利用层面再确认存储卷是不是能正常拜访,最后发明RAC数据库仍旧能正常运行。
3
Linux仄台的Oracle RAC情况真战
Oracle RAC运行于Linux平台是今朝比较罕见的安排款式格式,并且最年夜限制的保证营业的连续运止是Dell宾户比拟关系的话题。
经过过程将Linux平台的Oracle RAC 取LVAFO联合,能完成一个单机双柜的架构本相。在主机层面经由进程Oracle RAC实现下可用性,当一个主机呈现故障后,RAC中的别的节点能持续供给数据库效劳。在存储层面,当一台存储涌现故障后,IO切换到别的一台存储上。
在存储SC4020-A上创立一个数据卷Data Disk和一个Voting Disk,将卷同时映射给服务器R910-A、R910-B。
在服务器上使用ASMLIB封装数据卷Data Disk和 Voting Disk。
办事器A、B之间运转Oracle RAC。
[root@ljjr910-a ~]# crsstat -t
Name Type Target State Host
————————————————-
ora.DATA.dg ora….up.type ONLINE ONLINE ljjr910-a
ora.GRID.dg ora….up.type ONLINE ONLINE ljjr910-a
ora….ER.lsnr ora….er.type ONLINE ONLINE ljjr910-a
ora….N1.lsnr ora….er.type ONLINE ONLINE ljjr910-b
ora.asm ora.asm.type ONLINE ONLINE ljjr910-a
ora.cvu ora.cvu.type ONLINE ONLINE ljjr910-b
ora.dsc.db ora….se.type ONLINE ONLINE ljjr910-a
ora.gsd ora.gsd.type OFFLINE OFFLINE
ora….SM1.asm application ONLINE ONLINE ljjr910-a
ora….-A.lsnr application ONLINE ONLINE ljjr910-a
ora….0-a.gsd application OFFLINE OFFLINE
ora….0-a.ons application ONLINE ONLINE ljjr910-a
ora….0-a.vip ora….t1.type ONLINE ONLINE ljjr910-a
ora….SM2.asm application ONLINE ONLINE ljjr910-b
ora….-B.lsnr application ONLINE ONLINE ljjr910-b
ora….0-b.gsd application OFFLINE OFFLINE
ora….0-b.ons application ONLINE ONLINE ljjr910-b
ora….0-b.vip ora….t1.type ONLINE ONLINE ljjr910-b
ora….network ora….rk.type ONLINE ONLINE ljjr910-a
ora.oc4j ora.oc4j.type ONLINE ONLINE ljjr910-b
ora.ons ora.ons.type ONLINE ONLINE ljjr910-a
ora.scan1.vip ora….ip.type ONLINE ONLINE ljjr910-b
将数据卷Data Disk跟Voting Disk卷设备成Live Volume Auto Failover,将数据从SC4020-A 同步复造到SC4020-B,确保相干卷的live volume配对付关联畸形。
在SC4020-B大将数据卷Data Disk和 Voting Disk卷对答的Live Volume卷也映射给服务器R910-A、R910-B;在服务器上查看,每个设备各有4条路径。
[root@ljjr910-a ~]# multipath -ll
mpathe (36000d31000f190000000000000000267) dm-2 COMPELNT,Compellent Vol
size=1.0G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:7:1 sda 8:0 active ready running
|- 3:0:11:1 sdc 8:32 active ready running
|- 3:0:15:1 sdh 8:112 active ready running
`- 3:0:21:1 sdj 8:144 active ready running
mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready running
|- 3:0:17:2 sde 8:64 active ready running
|- 3:0:13:2 sdg 8:96 active ready running
`- 3:0:19:2 sdi 8:128 active ready running
假如使用了多个Voting Disk,借须要调整ASM磁盘超时的参数asmhbeatiowait,该参数在Oracle11.2.0.4中默许是15秒,提议建改成120秒。
应用HammerDB对RAC数据库禁止压力测试。
在DSM管理界面,闭失落主存储,存储脚色主动切换到备存储。
而在测试过程傍边,在HammerDB的管理界面上可以看到,应用出现长久停留后继承运行。
“功德成双”,经由过程公道的架构计划,Dell Compellent SC系列存储可以多种环境如Windows 2012、VMware vSphere、Linux环境下,启载多种应用服务如Oracle RAC数据库、NAS服务、虚拟机系统、MSCS集群应用环境,实现真挚意思上的存储“双活”。