redis基础(四)-集群

目录

1、问题思考

容量不够,redis如何进行扩容?

并发写操作, redis如何分摊?

另外,主从模式,薪火相传模式,主机宕机,导致ip地址发生变化,应用程序中配置需要修改对应的主机地址、端口等信息。

之前通过代理主机来解决,但是redis3.0中提供了解决方案。就是无中心化集群配置。

2、什么是集群

Redis 集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N。

Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。

3、删除持久化数据

将rdb,aof文件都删除掉。(清理环境,干净环境无需处理)

4、源码编译产生一个节点

sudo yum install centos-release-scl scl-utils-build -y
sudo yum install -y devtoolset-8-toolchain
# 确保普通用也可以正常使用gcc命令(不要加sudo)
scl enable devtoolset-8 bash

cd /opt/module 
tar xf redis-6.2.6.tar.gz

cd redis-6.2.6

make

# 需要使用root权限在/usr/local/bin目录下生成可执行文件
sudo make install

sudo mkdir /opt/module/redis/{conf,logs} -p

sudo chown -R geray:geray /opt/module/redis

cp redis.conf /opt/module/redis/conf/redis.conf

5、制作6个实例(6379,6380,6381,6389,6390,6391)

1. 配置基本信息

开启daemonize yes(允许后台执行),并注释bind,并指定密码:requirepass redispasswd

关闭保护模式:`protected-mode no `

Pid文件名字

指定端口

Log文件名字

Dump.rdb名字

appendonly 关掉或者换名字

2. redis cluster配置修改

cluster-enabled yes: 打开集群模式

cluster-config-file nodes-6379.conf :设定节点配置文件名

cluster-node-timeout 15000: 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换。

include /opt/module/redis/conf/redis.conf
port 6379
pidfile "/var/run/redis_6379.pid"
dbfilename "dump6379.rdb"

# #######集群配置######
# RDB持久化中dir路径解析
# dir "/opt/module/redis/redis_cluster"
logfile "/opt/module/redis/logs/redis_err_6379.log"
# 打开集群模式
cluster-enabled yes
# 设定节点配置文件名
cluster-config-file /opt/module/redis/conf/nodes-6379.conf
# 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换。
cluster-node-timeout 15000

注意:确保所有文件的路径的权限和是否已经存在

3. 修改好redis6379.conf文件,拷贝多个redis.conf文件

cp redis6379.conf redis6380.conf 
cp redis6379.conf redis6381.conf 
cp redis6379.conf redis6389.conf 
cp redis6379.conf redis6390.conf 
cp redis6379.conf redis6391.conf 

4. 使用查找替换修改另外5个文件

例如::%s/6379/6380 (vim编辑器中直接输入修改所有)

5. 启动6个redis服务

redis-cluster.sh

#!/bin/bash

if [ $# -lt 1 ]
then
     echo "没有输入参数..."
     exit ;
fi

case $1 in
"start")
	echo " =================== 启动 redis 集群 ==================="
	
	echo " --------------- 启动 redis6379 ---------------"
	redis-server /opt/module/redis/conf/redis6379.conf
	echo " --------------- 启动 redis6380 ---------------"
	redis-server /opt/module/redis/conf/redis6380.conf
	echo " --------------- 启动 redis6381 ---------------"
	redis-server /opt/module/redis/conf/redis6381.conf
	echo " --------------- 启动 redis6389 ---------------"
	redis-server /opt/module/redis/conf/redis6389.conf
	echo " --------------- 启动 redis6390 ---------------"
	redis-server /opt/module/redis/conf/redis6390.conf
	echo " --------------- 启动 redis6391 ---------------"
	redis-server /opt/module/redis/conf/redis6391.conf
;;
"stop")
	echo " =================== 关闭 redis 集群 ==================="
	
	# ps -ef | grep redis | grep -v grep | awk {'print $2'} | xargs kill -9
	
	echo " --------------- 关闭 redis6379 ---------------"
	redis-cli -p 6379 shutdown
	echo " --------------- 关闭 redis6380 ---------------"
	redis-cli -p 6380 shutdown
	echo " --------------- 关闭 redis6381 ---------------"
	redis-cli -p 6381 shutdown
	echo " --------------- 关闭 redis6389 ---------------"
	redis-cli -p 6389 shutdown
	echo " --------------- 关闭 redis6390 ---------------"
	redis-cli -p 6390 shutdown
	echo " --------------- 关闭 redis6391 ---------------"
	redis-cli -p 6391 shutdown
;;
*)
	echo "Input Args Error..."
;;
esac
chmod +x redis-cluster.sh
./redis-cluster.sh start

启动错误:

4649:M 14 Apr 2022 14:53:49.569 # You requested maxclients of 10000 requiring at least 10032 max file descriptors.
4649:M 14 Apr 2022 14:53:49.570 # Server can't set maximum open files to 10032 because of OS error: Operation not permitted.
4649:M 14 Apr 2022 14:53:49.570 # Current maximum open files is 4096. maxclients has been reduced to 4064 to compensate for low ulimit. If you need higher maxclients increase 'ulimit -n'.
4649:M 14 Apr 2022 14:53:49.570 * monotonic clock: POSIX clock_gettime
4649:M 14 Apr 2022 14:53:49.570 # Can't open nodes-6379.conf in order to acquire a lock: Permission denied	# 权限问题

在CentOS 7/RHEL 7中,Systemd替代了之前的SysV,因此/etc/security/limits.conf文件的配置作用域变小了一些。limits.conf这里的配置,只适用于通过PAM认证登录用户的资源限制,它对systemd的service的资源限制不生效。登录用户的限制,与上面讲的一样,通过/etc/security/limits.conf和limits.d 来配置即可。

解决办法:

vi /etc/security/limits.conf
## 添加
* soft nofile 65535
* hard nofile 65535

vi /etc/systemd/system.conf
## 添加
DefaultLimitNOFILE=65535

vi /etc/systemd/system/redis.service
## 添加
# open files
LimitNOFILE=65536

ulimit -n 65535

警告2:

WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take
 effect

内核参数 overcommit_memory 它是 内存分配策略。可选值:0、1、2。

0, 表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否则,内存申请失败,并把错误返回给应用进程。 1, 表示内核允许分配所有的物理内存,而不管当前的内存状态如何。 2, 表示内核允许分配超过所有物理内存和交换空间总和的内存

解决:

修改内核参数,要有root权限:
方法 1:编辑 /etc/sysctl.conf ,新增一行vm.overcommit_memory=1,然后sysctl -p使配置文件生效。
方法 2:临时设置:sysctl vm.overcommit_memory=1

6. 将六个节点合成一个集群

组合之前,请确保所有redis实例启动后,nodes-xxxx.conf文件都生成正常。

1)合体(只能在src目录下执行)

低版本(6.2版本之前)可能需要额外安装相关环境

高版本的已经分装了相关环境到了redis-check-rdb

进入到最开始的源码编译时的解压文件的src目录中

cd /opt/module/redis-6.2.6/src

redis-cli --cluster create --cluster-replicas 1 192.168.6.62:6379 192.168.6.62:6380 192.168.6.62:6381 192.168.6.62:6389 192.168.6.62:6390 192.168.6.62:6391

# 询问是否接受分配方式,输入yes接受即可
# 出现以下信息(16384)
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.

此处不要用127.0.0.1, 请用真实IP地址

--replicas 1 采用最简单的方式配置集群,一台主机,一台从机,正好三组。

2)普通方式登录(写操作可能会报错)

可能直接进入读主机,存储数据时,会出现MOVED重定向操作。所以,应该以集群方式登录。

[geray@hadoop62 redis]$ redis-cli -p 6379
127.0.0.1:6379> set k1 v1
(error) MOVED 12706 192.168.6.62:6381
127.0.0.1:6379> 

6、-c 采用集群策略连接,设置数据会自动切换到相应的写主机

[geray@hadoop62 redis]$ redis-cli -c -p 6379
127.0.0.1:6379> set k1 v1
-> Redirected to slot [12706] located at 192.168.6.62:6381
OK
192.168.6.62:6381> 

7、通过 cluster nodes 命令查看集群信息

192.168.6.62:6381> cluster nodes
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 master - 0 1649925506947 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 myself,master - 0 1649925504000 3 connected 10923-16383
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649925504000 2 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master - 0 1649925503000 1 connected 0-5460
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 slave 213287f2d6b5267d5ba99348075b5d9ea1fd94e9 0 1649925505939 1 connected
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649925503000 3 connected
192.168.6.62:6381> 

8、redis cluster 如何分配这六个节点?

一个集群至少要有三个主节点

选项 --cluster-replicas 1 表示我们希望为集群中的每个主节点创建一个从节点。

分配原则尽量保证每个主数据库运行在不同的IP地址,每个从库和主库不在一个IP地址上。

9、什么是slots?

slots后是插槽数

[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.

一个 Redis 集群包含 16384 个插槽(hash slot), 数据库中的每个键都属于这 16384 个插槽的其中一个,

集群使用公式 CRC16(key) % 16384 来计算键 key 属于哪个槽, 其中 CRC16(key) 语句用于计算键 key 的 CRC16 校验和 。

集群中的每个节点负责处理一部分插槽。 举个例子, 如果一个集群可以有主节点, 其中:

节点 A 负责处理 0 号至 5460 号插槽。

节点 B 负责处理 5461 号至 10922 号插槽。

节点 C 负责处理 10923 号至 16383 号插槽。

10、在集群中录入值

在redis-cli每次录入、查询键值,redis都会计算出该key应该送往的插槽,如果不是该客户端对应服务器的插槽,redis会报错,并告知应前往的redis实例地址和端口。

redis-cli客户端提供了 –c 参数实现自动重定向。

如 redis-cli -c –p 6379 登入后,再录入、查询键值对可以自动重定向。

不在一个slot下的键值,是不能使用mget,mset等多键操作。

192.168.6.62:6379> mset k1 v1 k2 v2 k3 v3
(error) CROSSSLOT Keys in request don't hash to the same slot

多个值没法计算插槽;

可以将多个值分成组的方式进行操作

可以通过{组名}来定义组的概念,从而使key中{}内相同内容的键值对放到一个slot中去

192.168.6.62:6379> mset k1{cust} v1 k2{cust} v2 k3{cust} v3
OK

11、查询集群中的值

CLUSTER GETKEYSINSLOT <slot><count> 返回 count 个 slot 槽中的键。

计算key的插槽值:cluster keyslot <key>

计算插槽值中有多少个key(只能查看当前主从的插槽的值):cluster countkeysinslot <插槽值>

获取某个插槽中的key:cluster getkeysinslot <插槽值> <数量>

192.168.6.62:6379> cluster keyslot cust
(integer) 4847
192.168.6.62:6379> cluster countkeysinslot 4847
(integer) 3
192.168.6.62:6379> cluster getkeysinslot 4847 3
1) "k1{cust}"
2) "k2{cust}"
3) "k3{cust}"
192.168.6.62:6379>

12、故障恢复

如果主节点下线?从节点能否自动升为主节点?注意:15秒超时

6379状态为fail,并且从节点变为master

192.168.6.62:6379> shutdown 

[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649930409826 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master,fail - 1649930379567 1649930376000 1 disconnected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649930409000 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649930408000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649930409000 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649930407807 7 connected 0-5460

主节点恢复后,主从关系会如何?主节点回来变成从机

[geray@hadoop62 redis]$ redis-server /opt/module/redis/conf/redis6379.conf

[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649931855000 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 slave ae24333766fccba657912796bffdbc84495be855 0 1649931855000 7 connected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649931857083 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649931857000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649931855071 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649931856077 7 connected 0-5460

如果所有某一段插槽的主从节点都宕掉,redis服务是否还能继续?

如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为yes ,那么 ,整个集群都挂掉

如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为no ,那么,该插槽数据全都不能使用,也无法存储。

redis.conf中的参数 cluster-require-full-coverage

13、集群的Jedis开发

即使连接的不是主机,集群会自动切换主机存储。主机写,从机读。

无中心化主从集群。无论从哪台主机写的数据,其他主机上都能读到数据。

public class JedisClusterTest {
  public static void main(String[] args) { 
     Set<HostAndPort>set =new HashSet<HostAndPort>();
     // url任意即可
     set.add(new HostAndPort("192.168.6.62",6379));
     JedisCluster jedisCluster=new JedisCluster(set);
     jedisCluster.set("k1", "v1");
     System.out.println(jedisCluster.get("k1"));
  }
}

14、Redis 集群提供了以下好处

实现扩容

分摊压力

无中心配置相对简单

15、Redis 集群的不足

多键操作是不被支持的

多键的Redis事务是不被支持的。lua脚本不被支持

由于集群方案出现较晚,很多公司已经采用了其他的集群方案,而代理或者客户端分片的方案想要迁移至redis cluster,需要整体迁移而不是逐步过渡,复杂度较大。