群集的基本概念

  • 一、群集的含义
    • 1.1 群集的产生
    • 1.2 群集构成方案
  • 二、群集可分为三种
    • 负载均衡群集(Load Balance Cluster)
    • 高可用群集 (High Availability Cluster)
    • 高性能群集(High Performance Computer Cluster)
  • 三、负载均衡群集架构
    • 负载均衡的结构
      • 第一层,负载调度器(Load Balancer或Director)
      • 第二层,服务器池(Server Pool)
      • 第三层,共享存储(Share Storage)
  • 四、负载均衡群集工作模式分析
    • 负载均衡群集是目前企业用得最多的群集类型
    • 群集的负载调度技术有3种工作模式
  • 五、三种负载调度工作模式
    • 5.1 NAT模式
    • 5.2 TUN模式
    • 5.3 DR模式
  • 六、LVS虚拟服务器
  • 七、LVS的负载调度算法
    • 7.1 轮询(Round Robin)
    • 7.2 加权轮询 (Weighted Round Robin)
    • 7.3 最少连接 (Least Connections )
    • 7.4 加权最少连接(Weighted L east Connections )
  • 八、ipvsadm工具

一、群集的含义

  • 群集(或称为集群)是由多台主机构成,但对外,只表现为一个整体,只提供一个访问入口(域名或IP),相当于一台大型计算机。

1.1 群集的产生

  • 互联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器开始无法满足负载均衡及高可用的需求,群集因此应运而生。

1.2 群集构成方案

  • 使用价格昂贵的小型机、大型机组成群集。
  • 使用多台相对廉价的普通服务器构建服务群集。
  • 通过整合多台服务器,使用LVS来达到服务器高可用和负载均衡,并于同一个IP地址对外提供相同服务。这就是企业中常用的一种群集技术——LVS(Linux Virtual Server ,Linux虚拟服务器)。

二、群集可分为三种

  • 根据集群针对的目标差异,可分为三种

负载均衡群集(Load Balance Cluster)

  • 提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能。

高可用群集 (High Availability Cluster)

  • 提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA) 的容错效果。
  • HA的工作方式包括双工和主从两种模式,双工即所有节点同时在线;主从则只有主节点在线,但当出现故障时从节点能自动切换为主节点。
  • 例如:“故障切换”、“双机热备” 等。

高性能群集(High Performance Computer Cluster)

  • 以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力。
  • 高性能依赖于"分布式运算”、“并行计算” , 通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力。
  • 例如,“云计算”、“网格计算”等。

三、负载均衡群集架构

负载均衡的结构

第一层,负载调度器(Load Balancer或Director)

  • 访问整个群集系统的唯一入口, 对外使用所有服务器共有的VIP地址,也称为群集IP地址。通常会配置主、备两台调度器实现热备份,当主调度器失效以后能够平滑替换至备用调度器,确保高可用性。

第二层,服务器池(Server Pool)

  • 群集所提供的应用服务、由服务器池承担,其中每个节点具有独立的RIP地址(真实IP),只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。

第三层,共享存储(Share Storage)

  • 为服务器池中的所有节点提供稳定、一致的文件存取服务, 确保整个群集的统一性共享存储可以使用NAS设备,或者提供NFS共享服务的专用服务器。

四、负载均衡群集工作模式分析

负载均衡群集是目前企业用得最多的群集类型

群集的负载调度技术有3种工作模式

  • 地址转换(NAT模式)
  • IP隧道 (TUN模式)
  • 直接路由(DR模式)

五、三种负载调度工作模式

5.1 NAT模式

  • 地址转换(Network Address Translation),简称NAT模式
    类似于防火墙的私有网络结构,负载调度器作为所有服务器节点的网关,即作为客户机的访问入口,也是各节点回应客户机的访问出口
    服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两种方式

5.2 TUN模式

  • IP隧道(IP Tunnel),简称TUN模式
    采用开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器
    服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信

5.3 DR模式

  • 直接路由(Direct Routing),简称DR模式
    采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络
    负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道

六、LVS虚拟服务器

  • LVS(Linux Virtual Server)
    • 针对Linux内核开发的负载均衡解决方案
    • 1998年5月,由我国的章文嵩博士创建
    • 官方网站: http://www.linuxvirtualserver.orgl
    • LVS 实际上相当于基于IP地址的虚拟化应用, 为基于IP地址和内容请求分发的负载均衡提出了一种高效的解决方法

LVS现在已成为Linux内核的一部分,默认编译为ip_ vs模块,必要时能够自动调用。在CentOS 7系统中,以下操作可以手动加载ip_ vs模块,并查看当前系统中ip_ vs模块的版本信息。

modprobe ip_vs
cat /proc/net/ip_vs       #确认内核对LVS的支持

七、LVS的负载调度算法

7.1 轮询(Round Robin)

  • 将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器) ,均等地对待每一台服务器 ,而不管服务器实际的连接数和系统负载

7.2 加权轮询 (Weighted Round Robin)

  • 根据调度器设置的权重值来分发请求,权重值高的节点优先获得任务,分配的请求数越多
    保证性能强的服务器承担更多的访问流量

7.3 最少连接 (Least Connections )

  • 根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点

7.4 加权最少连接(Weighted L east Connections )

  • 在服务器节点的性能差异较大时,可以为真实服务器自动调整权重
    性能较高的节点将承担更大比例的活动连接负载

八、ipvsadm工具

  • ipvsadm功能与选项说明
选项 功能
-A 添加虚拟服务器
-D 删除整个虚拟服务器
-s 指定负载调度算法(轮询:rr、加权轮询:wrr、最少连接:lc、加权最少连接:wlc)
-a 表示添加真实服务器(节点服务器)
-d 删除某一个节点
-t 指定 VIP地址及 TCP端口
-r 指定 RIP地址及 TCP端口
-m 表示使用 NAT群集模式
-g 表示使用 DR模式
-i 表示使用 TUN模式
-w 设置权重(权重为 0 时表示暂停节点)
-p 60 表示保持长连接60秒
-l 列表查看 LVS 虚拟服务器(默认为查看所有)
-n 以数字形式显示地址、端口等信息,常与“-l”选项组合使用。ipvsadm -ln