Case Center产品案例

RoseHA 双机高可用方案

RoseHA双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统连接,用户的操作系统、应用软件和RoseHA高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoseHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被RoseHA软件捕捉。当捕捉到这种变化后RoseHA就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供TCP/IP网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕后,可以根据RoseHA的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。

RoseHA容错功能实现的关键是在系统发生错误进行切换时,对客户端来说主机是透明的,即主机的切换在工作端看来没有变化,所有基于主机的应用都正常。RoseHA采用了虚拟IP地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换虚拟地址始终指向工作主机,在客户端看来主机是透明的。在进行网络服务时,在双机系统后台RoseHA提供一个逻辑的虚拟地址,任何一个客户端需要访问系统时只需要使用这个虚拟地址。当双机系统中的一台服务器出现故障时,RoseHA会将这个虚拟地址切换到另外一台服务器上,继续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务也没有间断。除IP地址外,HA还可以提供虚拟的计算机别名供客户端访问。对于数据库服务,当有一台服务器出现故障时,另外一台服务器就会自动接管数据库引擎,同时启动数据库和应用程序,使用户数据库可以正常操作。

当Active主机发生故障时, RoseHA将自动将服务迅速的切换到备机。并在共享存储备的基础上,继续为客户端提供业务服务。

 20180712065285738573.png

自动切换

当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232/SCSI/网络线缆断开),RoseHA 将确定由于某种故障而终止的应用,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。

自动检测

在集群系统的每一台服务器内,RoseHA 具有两个核心进程,他们互相监控(如:系统宕机、HA进程被杀掉、RS-232、网络、SCSI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复。

支持多条心跳路径

可以将网线和RS-232串口线作为在集群系统上运行的RoseHA的心跳线。配置多条心跳路径可以避免系统的单点故障。

网络可靠性

如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。如果该服务器配备了冗余的网络接口,RoseHA 会使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,HA会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。

磁盘可靠性

需要将应用的全部数据存储在两台服务器都能访问到的共享磁盘中。建议使用磁盘阵列来存储数据,这样可以避免单点失败,而且便于对系统的容量进行扩充。对由Volume Manager管理的磁盘阵列,RoseHA提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。



来自:本站 发布时间:2019-04-16 15:15:43



首页 电话 邮箱 导航