群集的基本概念

一、群集的含义
- 1.1 群集的产生
- 1.2 群集构成方案
二、群集可分为三种
- 负载均衡群集(Load Balance Cluster)
- 高可用群集 (High Availability Cluster)
- 高性能群集(High Performance Computer Cluster)
三、负载均衡群集架构
- 负载均衡的结构
- - 第一层，负载调度器(Load Balancer或Director)
  - 第二层，服务器池(Server Pool)
  - 第三层，共享存储(Share Storage)
四、负载均衡群集工作模式分析
- 负载均衡群集是目前企业用得最多的群集类型
- 群集的负载调度技术有3种工作模式
五、三种负载调度工作模式
- 5.1 NAT模式
- 5.2 TUN模式
- 5.3 DR模式
六、LVS虚拟服务器
七、LVS的负载调度算法
- 7.1 轮询(Round Robin)
- 7.2 加权轮询 (Weighted Round Robin)
- 7.3 最少连接 (Least Connections )
- 7.4 加权最少连接(Weighted L east Connections )
八、ipvsadm工具

一、群集的含义

群集（或称为集群）是由多台主机构成，但对外，只表现为一个整体，只提供一个访问入口（域名或IP），相当于一台大型计算机。

1.1 群集的产生

互联网应用中，随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高，单台服务器开始无法满足负载均衡及高可用的需求，群集因此应运而生。

1.2 群集构成方案

使用价格昂贵的小型机、大型机组成群集。
使用多台相对廉价的普通服务器构建服务群集。
通过整合多台服务器，使用LVS来达到服务器高可用和负载均衡，并于同一个IP地址对外提供相同服务。这就是企业中常用的一种群集技术——LVS（Linux Virtual Server ，Linux虚拟服务器）。

二、群集可分为三种

根据集群针对的目标差异，可分为三种

负载均衡群集(Load Balance Cluster)

提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标，获得高并发、高负载(LB)的整体性能。

高可用群集 (High Availability Cluster)

提高应用系统的可靠性、尽可能地减少中断时间为目标，确保服务的连续性，达到高可用(HA) 的容错效果。
HA的工作方式包括双工和主从两种模式，双工即所有节点同时在线；主从则只有主节点在线，但当出现故障时从节点能自动切换为主节点。
例如：“故障切换”、“双机热备” 等。

高性能群集(High Performance Computer Cluster)

以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标，获得相当于大型、超级计算机的高性能运算(HPC)能力。
高性能依赖于"分布式运算”、“并行计算” ，通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起，实现只有大型、超级计算机才具备的计算能力。
例如，“云计算”、“网格计算”等。

三、负载均衡群集架构

负载均衡的结构

第一层，负载调度器(Load Balancer或Director)

访问整个群集系统的唯一入口，对外使用所有服务器共有的VIP地址，也称为群集IP地址。通常会配置主、备两台调度器实现热备份，当主调度器失效以后能够平滑替换至备用调度器，确保高可用性。

第二层，服务器池(Server Pool)

群集所提供的应用服务、由服务器池承担，其中每个节点具有独立的RIP地址(真实IP)，只处理调度器分发过来的客户机请求。当某个节点暂时失效时，负载调度器的容错机制会将其隔离，等待错误排除以后再重新纳入服务器池。

第三层，共享存储(Share Storage)

为服务器池中的所有节点提供稳定、一致的文件存取服务，确保整个群集的统一性共享存储可以使用NAS设备,或者提供NFS共享服务的专用服务器。

四、负载均衡群集工作模式分析

负载均衡群集是目前企业用得最多的群集类型

群集的负载调度技术有3种工作模式

地址转换（NAT模式）
IP隧道（TUN模式）
直接路由（DR模式）

五、三种负载调度工作模式

5.1 NAT模式

地址转换（Network Address Translation），简称NAT模式
类似于防火墙的私有网络结构，负载调度器作为所有服务器节点的网关，即作为客户机的访问入口，也是各节点回应客户机的访问出口
服务器节点使用私有IP地址，与负载调度器位于同一个物理网络，安全性要优于其他两种方式

5.2 TUN模式

IP隧道（IP Tunnel）,简称TUN模式
采用开放式的网络结构，负载调度器仅作为客户机的访问入口，各节点通过各自的Internet连接直接回应客户机，而不再经过负载调度器
服务器节点分散在互联网中的不同位置,具有独立的公网IP地址，通过专用IP隧道与负载调度器相互通信

5.3 DR模式

直接路由（Direct Routing），简称DR模式
采用半开放式的网络结构，与TUN模式的结构类似，但各节点并不是分散在各地，而是与调度器位于同一个物理网络
负载调度器与各节点服务器通过本地网络连接，不需要建立专用的IP隧道

六、LVS虚拟服务器

LVS(Linux Virtual Server)
- 针对Linux内核开发的负载均衡解决方案
- 1998年5月，由我国的章文嵩博士创建
- 官方网站: http://www.linuxvirtualserver.orgl
- LVS 实际上相当于基于IP地址的虚拟化应用，为基于IP地址和内容请求分发的负载均衡提出了一种高效的解决方法

LVS现在已成为Linux内核的一部分，默认编译为ip_ vs模块，必要时能够自动调用。在CentOS 7系统中，以下操作可以手动加载ip_ vs模块，并查看当前系统中ip_ vs模块的版本信息。

modprobe ip_vs
cat /proc/net/ip_vs       #确认内核对LVS的支持

七、LVS的负载调度算法

7.1 轮询(Round Robin)

将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器) ,均等地对待每一台服务器，而不管服务器实际的连接数和系统负载

7.2 加权轮询 (Weighted Round Robin)

根据调度器设置的权重值来分发请求，权重值高的节点优先获得任务，分配的请求数越多
保证性能强的服务器承担更多的访问流量

7.3 最少连接 (Least Connections )

根据真实服务器已建立的连接数进行分配，将收到的访问请求优先分配给连接数最少的节点

7.4 加权最少连接(Weighted L east Connections )

在服务器节点的性能差异较大时，可以为真实服务器自动调整权重
性能较高的节点将承担更大比例的活动连接负载

八、ipvsadm工具

ipvsadm功能与选项说明

选项	功能
-A	添加虚拟服务器
-D	删除整个虚拟服务器
-s	指定负载调度算法（轮询：rr、加权轮询：wrr、最少连接：lc、加权最少连接：wlc）
-a	表示添加真实服务器（节点服务器）
-d	删除某一个节点
-t	指定 VIP地址及 TCP端口
-r	指定 RIP地址及 TCP端口
-m	表示使用 NAT群集模式
-g	表示使用 DR模式
-i	表示使用 TUN模式
-w	设置权重（权重为 0 时表示暂停节点）
-p 60	表示保持长连接60秒
-l	列表查看 LVS 虚拟服务器（默认为查看所有）
-n	以数字形式显示地址、端口等信息，常与“-l”选项组合使用。ipvsadm -ln