引言:

通过PIGOSS BSM高可用方案,解决单点故障,实现多节点数据的统一,用于数据备份和保护主、备份服务器间的服务切换,以确保服务的连续性。

软件的高可用性指系统通过设计确保长时间无中断服务的能力,核心目标是最大化正常运行时间并实现故

障快速恢复。

高可用性关注系统对用户的持续可访问性,通过冗余设计和快速故障转移减少停机时间。例如,云服务多数据中心部署可在单点故障时自动切换节点维持服务。与‌高可靠性(强调系统自身无故障运行)的区别在于:高可用性容忍故障但要求快速恢复,而高可靠性追求故障率最低。

PIGOSS BSM高可用方案

通过PIGOSS BSM高可用方案,解决单点故障,实现多节点数据的统一,用于数据备份和保护主、备份服务器间的服务切换,以确保服务的连续性。

整体方案架构

打开网易新闻 查看精彩图片

PIGOSS BSM 的高可用分为两部分来实现:

  • BSM应用的高可用,实现应用所在节点故障,自动切换到无故障节点,不间断提供服务;另外一部分是多节点间的数据统一,确保数据安全。
  • BSM使用Pacemaker来实现应用的高可用和数据的统一性。

------Pacemaker是一个开源的集群管理软件,由多个组件组成,将所有节点加入集群之后,并将BSM应用模块创建为资源组,Pacemaker就会不间断的通过systemd脚本来监控集群资源的状态,若资源组里的资源状态异常,便会自动触发节点切换,实现应用的连续性.

BSM的性能数据是通过rsync同步或者influxdb集群的方式来实现多个节点同步备份,保证节点间的性能数据一致。

节点配置要求:

BSM高可用所需服务器的数量以及服务器的配置取决于要接入的数据量,以下按应用单机部署给出相应的节点数量及配置:(数据量超出单机所能负载的量需要根据实际需要接入的指标量进行定制)

BSM部署所需的硬件配置,监控节点梯度对应的硬件配置如下:

a. 单台BSM支持500节点

  • 服务器节点数:2个
  • CPU:4核8线程,3.4G频率
  • 内存:16GB
  • 磁盘:1T SATA

b. 单台BSM支持1000节点:

  • 服务器节点数:2个
  • CPU:4核8线程,3.4G频率
  • 内存:16GB
  • 磁盘:1T SSD

【BSM每个节点需要单独的IP地址,整体BSM集群需要对外的虚机IP地址】

依赖软件要求

  • Pacemaker:1.1.19
  • rsync:3.1.2(或者influxdb:0.11.1)
  • Mysql:5.5.47

依赖网络要求:

针对高可用BSM,需要提供对外可以访问的虚拟IP地址。

并且针对两个BSM节点,必须处于内网,无防火墙策略,互联互通。

原厂授权要求:

做高可用的两个BSM节点,需要有同样的授权,包括节点数和模块授权。即高可用BSM总体需要双倍授权。

软件的高可用性通过冗余设计、故障自动转移及实时监控等机制,显著提升系统稳定性

一、保障业务连续性,降低经济损失‌

‌预防意外中断‌:
当硬件故障、网络波动或人为误操作导致服务异常时,高可用架构能自动触发故障转移,确保服务秒级恢复,避免交易中断或数据丢失。例如:交易系统主节点宕机时,备用节点立即接管,用户无感知完成交易。

‌优化计划内维护‌:
支持滚动升级与灰度发布,系统可在不中断服务的前提下完成更新,消除传统维护导致的停机时间。

二、提升用户体验与信任度

满足用户高期望‌:

数字化时代用户要求服务“永不掉线”,高可用性维持99.9%+的可用率,避免因服务不可用导致的用户流失。

‌增强品牌声誉‌:
稳定的服务提升用户信任,尤其在金融、医疗等关键领域,可用性直接关联企业公信力。