redis基础（四）-集群

2022-04-12 | 阅读：次

1、问题思考
2、什么是集群
3、删除持久化数据
4、源码编译产生一个节点
5、制作6个实例（6379,6380,6381,6389,6390,6391）
6、-c 采用集群策略连接，设置数据会自动切换到相应的写主机
7、通过 cluster nodes 命令查看集群信息
8、redis cluster 如何分配这六个节点?
9、什么是slots？
10、在集群中录入值
11、查询集群中的值
12、故障恢复
13、集群的Jedis开发
14、Redis 集群提供了以下好处
15、Redis 集群的不足

1、问题思考

容量不够，redis如何进行扩容？

并发写操作， redis如何分摊？

另外，主从模式，薪火相传模式，主机宕机，导致ip地址发生变化，应用程序中配置需要修改对应的主机地址、端口等信息。

之前通过代理主机来解决，但是redis3.0中提供了解决方案。就是无中心化集群配置。

2、什么是集群

Redis 集群实现了对Redis的水平扩容，即启动N个redis节点，将整个数据库分布存储在这N个节点中，每个节点存储总数据的1/N。

Redis 集群通过分区（partition）来提供一定程度的可用性（availability）：即使集群中有一部分节点失效或者无法进行通讯，集群也可以继续处理命令请求。

3、删除持久化数据

将rdb,aof文件都删除掉。（清理环境，干净环境无需处理）

4、源码编译产生一个节点

sudo yum install centos-release-scl scl-utils-build -y
sudo yum install -y devtoolset-8-toolchain
# 确保普通用也可以正常使用gcc命令（不要加sudo）
scl enable devtoolset-8 bash

cd /opt/module 
tar xf redis-6.2.6.tar.gz

cd redis-6.2.6

make

# 需要使用root权限在/usr/local/bin目录下生成可执行文件
sudo make install

sudo mkdir /opt/module/redis/{conf,logs} -p

sudo chown -R geray:geray /opt/module/redis

cp redis.conf /opt/module/redis/conf/redis.conf

5、制作6个实例（6379,6380,6381,6389,6390,6391）

1. 配置基本信息

开启daemonize yes（允许后台执行），并注释bind，~~并指定密码：requirepass redispasswd~~

关闭保护模式：`protected-mode no `

Pid文件名字

指定端口

Log文件名字

Dump.rdb名字

appendonly 关掉或者换名字

2. redis cluster配置修改

cluster-enabled yes：打开集群模式

cluster-config-file nodes-6379.conf ：设定节点配置文件名

cluster-node-timeout 15000：设定节点失联时间，超过该时间（毫秒），集群自动进行主从切换。

include /opt/module/redis/conf/redis.conf
port 6379
pidfile "/var/run/redis_6379.pid"
dbfilename "dump6379.rdb"

# #######集群配置######
# RDB持久化中dir路径解析
# dir "/opt/module/redis/redis_cluster"
logfile "/opt/module/redis/logs/redis_err_6379.log"
# 打开集群模式
cluster-enabled yes
# 设定节点配置文件名
cluster-config-file /opt/module/redis/conf/nodes-6379.conf
# 设定节点失联时间，超过该时间（毫秒），集群自动进行主从切换。
cluster-node-timeout 15000

注意：确保所有文件的路径的权限和是否已经存在

3. 修改好redis6379.conf文件，拷贝多个redis.conf文件

cp redis6379.conf redis6380.conf 
cp redis6379.conf redis6381.conf 
cp redis6379.conf redis6389.conf 
cp redis6379.conf redis6390.conf 
cp redis6379.conf redis6391.conf 

4. 使用查找替换修改另外5个文件

例如：:%s/6379/6380 （vim编辑器中直接输入修改所有）

5. 启动6个redis服务

redis-cluster.sh

#!/bin/bash

if [ $# -lt 1 ]
then
     echo "没有输入参数..."
     exit ;
fi

case $1 in
"start")
	echo " =================== 启动 redis 集群 ==================="
	
	echo " --------------- 启动 redis6379 ---------------"
	redis-server /opt/module/redis/conf/redis6379.conf
	echo " --------------- 启动 redis6380 ---------------"
	redis-server /opt/module/redis/conf/redis6380.conf
	echo " --------------- 启动 redis6381 ---------------"
	redis-server /opt/module/redis/conf/redis6381.conf
	echo " --------------- 启动 redis6389 ---------------"
	redis-server /opt/module/redis/conf/redis6389.conf
	echo " --------------- 启动 redis6390 ---------------"
	redis-server /opt/module/redis/conf/redis6390.conf
	echo " --------------- 启动 redis6391 ---------------"
	redis-server /opt/module/redis/conf/redis6391.conf
;;
"stop")
	echo " =================== 关闭 redis 集群 ==================="
	
	# ps -ef | grep redis | grep -v grep | awk {'print $2'} | xargs kill -9
	
	echo " --------------- 关闭 redis6379 ---------------"
	redis-cli -p 6379 shutdown
	echo " --------------- 关闭 redis6380 ---------------"
	redis-cli -p 6380 shutdown
	echo " --------------- 关闭 redis6381 ---------------"
	redis-cli -p 6381 shutdown
	echo " --------------- 关闭 redis6389 ---------------"
	redis-cli -p 6389 shutdown
	echo " --------------- 关闭 redis6390 ---------------"
	redis-cli -p 6390 shutdown
	echo " --------------- 关闭 redis6391 ---------------"
	redis-cli -p 6391 shutdown
;;
*)
	echo "Input Args Error..."
;;
esac

chmod +x redis-cluster.sh
./redis-cluster.sh start

启动错误：
4649:M 14 Apr 2022 14:53:49.569 # You requested maxclients of 10000 requiring at least 10032 max file descriptors.
4649:M 14 Apr 2022 14:53:49.570 # Server can't set maximum open files to 10032 because of OS error: Operation not permitted.
4649:M 14 Apr 2022 14:53:49.570 # Current maximum open files is 4096. maxclients has been reduced to 4064 to compensate for low ulimit. If you need higher maxclients increase 'ulimit -n'.
4649:M 14 Apr 2022 14:53:49.570 * monotonic clock: POSIX clock_gettime
4649:M 14 Apr 2022 14:53:49.570 # Can't open nodes-6379.conf in order to acquire a lock: Permission denied	# 权限问题
在CentOS 7/RHEL 7中，Systemd替代了之前的SysV，因此/etc/security/limits.conf文件的配置作用域变小了一些。limits.conf这里的配置，只适用于通过PAM认证登录用户的资源限制，它对systemd的service的资源限制不生效。登录用户的限制，与上面讲的一样，通过/etc/security/limits.conf和limits.d 来配置即可。

解决办法：
vi /etc/security/limits.conf
## 添加
* soft nofile 65535
* hard nofile 65535

vi /etc/systemd/system.conf
## 添加
DefaultLimitNOFILE=65535

vi /etc/systemd/system/redis.service
## 添加
# open files
LimitNOFILE=65536

ulimit -n 65535

警告2：
WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take
 effect
内核参数 overcommit_memory 它是内存分配策略。可选值：0、1、2。

0，表示内核将检查是否有足够的可用内存供应用进程使用；如果有足够的可用内存，内存申请允许；否则，内存申请失败，并把错误返回给应用进程。 1，表示内核允许分配所有的物理内存，而不管当前的内存状态如何。 2，表示内核允许分配超过所有物理内存和交换空间总和的内存

解决：
修改内核参数，要有root权限：
方法 1：编辑 /etc/sysctl.conf ，新增一行vm.overcommit_memory=1，然后sysctl -p使配置文件生效。
方法 2：临时设置：sysctl vm.overcommit_memory=1

6. 将六个节点合成一个集群

组合之前，请确保所有redis实例启动后，nodes-xxxx.conf文件都生成正常。

1）合体（只能在src目录下执行）

低版本（6.2版本之前）可能需要额外安装相关环境

高版本的已经分装了相关环境到了redis-check-rdb

进入到最开始的源码编译时的解压文件的src目录中

cd /opt/module/redis-6.2.6/src

redis-cli --cluster create --cluster-replicas 1 192.168.6.62:6379 192.168.6.62:6380 192.168.6.62:6381 192.168.6.62:6389 192.168.6.62:6390 192.168.6.62:6391

# 询问是否接受分配方式，输入yes接受即可
# 出现以下信息（16384）
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.

此处不要用127.0.0.1，请用真实IP地址

--replicas 1 采用最简单的方式配置集群，一台主机，一台从机，正好三组。

2）普通方式登录（写操作可能会报错）

可能直接进入读主机，存储数据时，会出现MOVED重定向操作。所以，应该以集群方式登录。

[geray@hadoop62 redis]$ redis-cli -p 6379
127.0.0.1:6379> set k1 v1
(error) MOVED 12706 192.168.6.62:6381
127.0.0.1:6379> 

6、-c 采用集群策略连接，设置数据会自动切换到相应的写主机

[geray@hadoop62 redis]$ redis-cli -c -p 6379
127.0.0.1:6379> set k1 v1
-> Redirected to slot [12706] located at 192.168.6.62:6381
OK
192.168.6.62:6381> 

7、通过 cluster nodes 命令查看集群信息

192.168.6.62:6381> cluster nodes
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 master - 0 1649925506947 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 myself,master - 0 1649925504000 3 connected 10923-16383
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649925504000 2 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master - 0 1649925503000 1 connected 0-5460
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 slave 213287f2d6b5267d5ba99348075b5d9ea1fd94e9 0 1649925505939 1 connected
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649925503000 3 connected
192.168.6.62:6381> 

8、redis cluster 如何分配这六个节点?

一个集群至少要有三个主节点。

选项 --cluster-replicas 1 表示我们希望为集群中的每个主节点创建一个从节点。

分配原则尽量保证每个主数据库运行在不同的IP地址，每个从库和主库不在一个IP地址上。

9、什么是slots？

slots后是插槽数

[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.

一个 Redis 集群包含 16384 个插槽（hash slot），数据库中的每个键都属于这 16384 个插槽的其中一个，

集群使用公式 CRC16(key) % 16384 来计算键 key 属于哪个槽，其中 CRC16(key) 语句用于计算键 key 的 CRC16 校验和。

集群中的每个节点负责处理一部分插槽。举个例子，如果一个集群可以有主节点，其中：

节点 A 负责处理 0 号至 5460 号插槽。

节点 B 负责处理 5461 号至 10922 号插槽。

节点 C 负责处理 10923 号至 16383 号插槽。

10、在集群中录入值

在redis-cli每次录入、查询键值，redis都会计算出该key应该送往的插槽，如果不是该客户端对应服务器的插槽，redis会报错，并告知应前往的redis实例地址和端口。

redis-cli客户端提供了 –c 参数实现自动重定向。

如 redis-cli -c –p 6379 登入后，再录入、查询键值对可以自动重定向。

不在一个slot下的键值，是不能使用mget,mset等多键操作。

192.168.6.62:6379> mset k1 v1 k2 v2 k3 v3
(error) CROSSSLOT Keys in request don't hash to the same slot

多个值没法计算插槽；

可以将多个值分成组的方式进行操作

可以通过{组名}来定义组的概念，从而使key中{}内相同内容的键值对放到一个slot中去。

192.168.6.62:6379> mset k1{cust} v1 k2{cust} v2 k3{cust} v3
OK

11、查询集群中的值

CLUSTER GETKEYSINSLOT <slot><count> 返回 count 个 slot 槽中的键。

计算key的插槽值：cluster keyslot <key>

计算插槽值中有多少个key（只能查看当前主从的插槽的值）：cluster countkeysinslot <插槽值>

获取某个插槽中的key：cluster getkeysinslot <插槽值> <数量>

192.168.6.62:6379> cluster keyslot cust
(integer) 4847
192.168.6.62:6379> cluster countkeysinslot 4847
(integer) 3
192.168.6.62:6379> cluster getkeysinslot 4847 3
1) "k1{cust}"
2) "k2{cust}"
3) "k3{cust}"
192.168.6.62:6379>

12、故障恢复

如果主节点下线？从节点能否自动升为主节点？注意：15秒超时

6379状态为fail，并且从节点变为master

192.168.6.62:6379> shutdown 

[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649930409826 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master,fail - 1649930379567 1649930376000 1 disconnected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649930409000 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649930408000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649930409000 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649930407807 7 connected 0-5460

主节点恢复后，主从关系会如何？主节点回来变成从机。

[geray@hadoop62 redis]$ redis-server /opt/module/redis/conf/redis6379.conf

[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649931855000 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 slave ae24333766fccba657912796bffdbc84495be855 0 1649931855000 7 connected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649931857083 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649931857000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649931855071 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649931856077 7 connected 0-5460

如果所有某一段插槽的主从节点都宕掉，redis服务是否还能继续?

如果某一段插槽的主从都挂掉，而cluster-require-full-coverage 为yes ，那么，整个集群都挂掉

如果某一段插槽的主从都挂掉，而cluster-require-full-coverage 为no ，那么，该插槽数据全都不能使用，也无法存储。

redis.conf中的参数 cluster-require-full-coverage

13、集群的Jedis开发

即使连接的不是主机，集群会自动切换主机存储。主机写，从机读。

无中心化主从集群。无论从哪台主机写的数据，其他主机上都能读到数据。

public class JedisClusterTest {
  public static void main(String[] args) { 
     Set<HostAndPort>set =new HashSet<HostAndPort>();
     // url任意即可
     set.add(new HostAndPort("192.168.6.62",6379));
     JedisCluster jedisCluster=new JedisCluster(set);
     jedisCluster.set("k1", "v1");
     System.out.println(jedisCluster.get("k1"));
  }
}

14、Redis 集群提供了以下好处

实现扩容

分摊压力

无中心配置相对简单

15、Redis 集群的不足

多键操作是不被支持的

多键的Redis事务是不被支持的。lua脚本不被支持

由于集群方案出现较晚，很多公司已经采用了其他的集群方案，而代理或者客户端分片的方案想要迁移至redis cluster，需要整体迁移而不是逐步过渡，复杂度较大。

朱守贵

Geray