1、问题思考
容量不够,redis如何进行扩容?
并发写操作, redis如何分摊?
另外,主从模式,薪火相传模式,主机宕机,导致ip地址发生变化,应用程序中配置需要修改对应的主机地址、端口等信息。
之前通过代理主机来解决,但是redis3.0中提供了解决方案。就是无中心化集群配置。
2、什么是集群
Redis 集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N。
Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。
3、删除持久化数据
将rdb,aof文件都删除掉。(清理环境,干净环境无需处理)
4、源码编译产生一个节点
sudo yum install centos-release-scl scl-utils-build -y
sudo yum install -y devtoolset-8-toolchain
# 确保普通用也可以正常使用gcc命令(不要加sudo)
scl enable devtoolset-8 bash
cd /opt/module
tar xf redis-6.2.6.tar.gz
cd redis-6.2.6
make
# 需要使用root权限在/usr/local/bin目录下生成可执行文件
sudo make install
sudo mkdir /opt/module/redis/{conf,logs} -p
sudo chown -R geray:geray /opt/module/redis
cp redis.conf /opt/module/redis/conf/redis.conf
5、制作6个实例(6379,6380,6381,6389,6390,6391)
1. 配置基本信息
开启daemonize yes(允许后台执行),并注释bind,并指定密码:requirepass redispasswd
关闭保护模式:`protected-mode no `
Pid文件名字
指定端口
Log文件名字
Dump.rdb名字
appendonly 关掉或者换名字
2. redis cluster配置修改
cluster-enabled yes
: 打开集群模式
cluster-config-file nodes-6379.conf
:设定节点配置文件名
cluster-node-timeout 15000
: 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换。
include /opt/module/redis/conf/redis.conf
port 6379
pidfile "/var/run/redis_6379.pid"
dbfilename "dump6379.rdb"
# #######集群配置######
# RDB持久化中dir路径解析
# dir "/opt/module/redis/redis_cluster"
logfile "/opt/module/redis/logs/redis_err_6379.log"
# 打开集群模式
cluster-enabled yes
# 设定节点配置文件名
cluster-config-file /opt/module/redis/conf/nodes-6379.conf
# 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换。
cluster-node-timeout 15000
注意:确保所有文件的路径的权限和是否已经存在
3. 修改好redis6379.conf文件,拷贝多个redis.conf文件
cp redis6379.conf redis6380.conf
cp redis6379.conf redis6381.conf
cp redis6379.conf redis6389.conf
cp redis6379.conf redis6390.conf
cp redis6379.conf redis6391.conf
4. 使用查找替换修改另外5个文件
例如::%s/6379/6380 (vim编辑器中直接输入修改所有)
5. 启动6个redis服务
redis-cluster.sh
#!/bin/bash
if [ $# -lt 1 ]
then
echo "没有输入参数..."
exit ;
fi
case $1 in
"start")
echo " =================== 启动 redis 集群 ==================="
echo " --------------- 启动 redis6379 ---------------"
redis-server /opt/module/redis/conf/redis6379.conf
echo " --------------- 启动 redis6380 ---------------"
redis-server /opt/module/redis/conf/redis6380.conf
echo " --------------- 启动 redis6381 ---------------"
redis-server /opt/module/redis/conf/redis6381.conf
echo " --------------- 启动 redis6389 ---------------"
redis-server /opt/module/redis/conf/redis6389.conf
echo " --------------- 启动 redis6390 ---------------"
redis-server /opt/module/redis/conf/redis6390.conf
echo " --------------- 启动 redis6391 ---------------"
redis-server /opt/module/redis/conf/redis6391.conf
;;
"stop")
echo " =================== 关闭 redis 集群 ==================="
# ps -ef | grep redis | grep -v grep | awk {'print $2'} | xargs kill -9
echo " --------------- 关闭 redis6379 ---------------"
redis-cli -p 6379 shutdown
echo " --------------- 关闭 redis6380 ---------------"
redis-cli -p 6380 shutdown
echo " --------------- 关闭 redis6381 ---------------"
redis-cli -p 6381 shutdown
echo " --------------- 关闭 redis6389 ---------------"
redis-cli -p 6389 shutdown
echo " --------------- 关闭 redis6390 ---------------"
redis-cli -p 6390 shutdown
echo " --------------- 关闭 redis6391 ---------------"
redis-cli -p 6391 shutdown
;;
*)
echo "Input Args Error..."
;;
esac
chmod +x redis-cluster.sh
./redis-cluster.sh start
启动错误:
4649:M 14 Apr 2022 14:53:49.569 # You requested maxclients of 10000 requiring at least 10032 max file descriptors. 4649:M 14 Apr 2022 14:53:49.570 # Server can't set maximum open files to 10032 because of OS error: Operation not permitted. 4649:M 14 Apr 2022 14:53:49.570 # Current maximum open files is 4096. maxclients has been reduced to 4064 to compensate for low ulimit. If you need higher maxclients increase 'ulimit -n'. 4649:M 14 Apr 2022 14:53:49.570 * monotonic clock: POSIX clock_gettime 4649:M 14 Apr 2022 14:53:49.570 # Can't open nodes-6379.conf in order to acquire a lock: Permission denied # 权限问题
在CentOS 7/RHEL 7中,Systemd替代了之前的SysV,因此/etc/security/limits.conf文件的配置作用域变小了一些。limits.conf这里的配置,只适用于通过PAM认证登录用户的资源限制,它对systemd的service的资源限制不生效。登录用户的限制,与上面讲的一样,通过/etc/security/limits.conf和limits.d 来配置即可。
解决办法:
vi /etc/security/limits.conf ## 添加 * soft nofile 65535 * hard nofile 65535 vi /etc/systemd/system.conf ## 添加 DefaultLimitNOFILE=65535 vi /etc/systemd/system/redis.service ## 添加 # open files LimitNOFILE=65536 ulimit -n 65535
警告2:
WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect
内核参数 overcommit_memory 它是 内存分配策略。可选值:0、1、2。
0, 表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否则,内存申请失败,并把错误返回给应用进程。 1, 表示内核允许分配所有的物理内存,而不管当前的内存状态如何。 2, 表示内核允许分配超过所有物理内存和交换空间总和的内存
解决:
修改内核参数,要有root权限: 方法 1:编辑 /etc/sysctl.conf ,新增一行vm.overcommit_memory=1,然后sysctl -p使配置文件生效。 方法 2:临时设置:sysctl vm.overcommit_memory=1
6. 将六个节点合成一个集群
组合之前,请确保所有redis实例启动后,nodes-xxxx.conf文件都生成正常。
1)合体(只能在src目录下执行)
低版本(6.2版本之前)可能需要额外安装相关环境
高版本的已经分装了相关环境到了
redis-check-rdb
进入到最开始的源码编译时的解压文件的src目录中
cd /opt/module/redis-6.2.6/src
redis-cli --cluster create --cluster-replicas 1 192.168.6.62:6379 192.168.6.62:6380 192.168.6.62:6381 192.168.6.62:6389 192.168.6.62:6390 192.168.6.62:6391
# 询问是否接受分配方式,输入yes接受即可
# 出现以下信息(16384)
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.
此处不要用127.0.0.1, 请用真实IP地址
--replicas 1
采用最简单的方式配置集群,一台主机,一台从机,正好三组。
2)普通方式登录(写操作可能会报错)
可能直接进入读主机,存储数据时,会出现MOVED重定向操作。所以,应该以集群方式登录。
[geray@hadoop62 redis]$ redis-cli -p 6379
127.0.0.1:6379> set k1 v1
(error) MOVED 12706 192.168.6.62:6381
127.0.0.1:6379>
6、-c 采用集群策略连接,设置数据会自动切换到相应的写主机
[geray@hadoop62 redis]$ redis-cli -c -p 6379
127.0.0.1:6379> set k1 v1
-> Redirected to slot [12706] located at 192.168.6.62:6381
OK
192.168.6.62:6381>
7、通过 cluster nodes 命令查看集群信息
192.168.6.62:6381> cluster nodes
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 master - 0 1649925506947 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 myself,master - 0 1649925504000 3 connected 10923-16383
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649925504000 2 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master - 0 1649925503000 1 connected 0-5460
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 slave 213287f2d6b5267d5ba99348075b5d9ea1fd94e9 0 1649925505939 1 connected
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649925503000 3 connected
192.168.6.62:6381>
8、redis cluster 如何分配这六个节点?
一个集群至少要有三个主节点。
选项 --cluster-replicas 1
表示我们希望为集群中的每个主节点创建一个从节点。
分配原则尽量保证每个主数据库运行在不同的IP地址,每个从库和主库不在一个IP地址上。
9、什么是slots?
slots后是插槽数
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.
一个 Redis 集群包含 16384 个插槽(hash slot), 数据库中的每个键都属于这 16384 个插槽的其中一个,
集群使用公式 CRC16(key) % 16384 来计算键 key 属于哪个槽, 其中 CRC16(key) 语句用于计算键 key 的 CRC16 校验和 。
集群中的每个节点负责处理一部分插槽。 举个例子, 如果一个集群可以有主节点, 其中:
节点 A 负责处理 0 号至 5460 号插槽。
节点 B 负责处理 5461 号至 10922 号插槽。
节点 C 负责处理 10923 号至 16383 号插槽。
10、在集群中录入值
在redis-cli每次录入、查询键值,redis都会计算出该key应该送往的插槽,如果不是该客户端对应服务器的插槽,redis会报错,并告知应前往的redis实例地址和端口。
redis-cli客户端提供了 –c 参数实现自动重定向。
如 redis-cli -c –p 6379 登入后,再录入、查询键值对可以自动重定向。
不在一个slot下的键值,是不能使用mget,mset等多键操作。
192.168.6.62:6379> mset k1 v1 k2 v2 k3 v3
(error) CROSSSLOT Keys in request don't hash to the same slot
多个值没法计算插槽;
可以将多个值分成组的方式进行操作
可以通过{组名}来定义组的概念,从而使key中{}内相同内容的键值对放到一个slot中去。
192.168.6.62:6379> mset k1{cust} v1 k2{cust} v2 k3{cust} v3
OK
11、查询集群中的值
CLUSTER GETKEYSINSLOT <slot><count>
返回 count 个 slot 槽中的键。
计算key的插槽值:
cluster keyslot <key>
计算插槽值中有多少个key(只能查看当前主从的插槽的值):
cluster countkeysinslot <插槽值>
获取某个插槽中的key:
cluster getkeysinslot <插槽值> <数量>
192.168.6.62:6379> cluster keyslot cust
(integer) 4847
192.168.6.62:6379> cluster countkeysinslot 4847
(integer) 3
192.168.6.62:6379> cluster getkeysinslot 4847 3
1) "k1{cust}"
2) "k2{cust}"
3) "k3{cust}"
192.168.6.62:6379>
12、故障恢复
如果主节点下线?从节点能否自动升为主节点?注意:15秒超时
6379状态为fail,并且从节点变为master
192.168.6.62:6379> shutdown
[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649930409826 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 master,fail - 1649930379567 1649930376000 1 disconnected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649930409000 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649930408000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649930409000 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649930407807 7 connected 0-5460
主节点恢复后,主从关系会如何?主节点回来变成从机。
[geray@hadoop62 redis]$ redis-server /opt/module/redis/conf/redis6379.conf
[geray@hadoop62 redis]$ redis-cli -c -p 6380
127.0.0.1:6380> cluster nodes
5fa234d83dcf157b40b0e72b3a61d1bcac3879b2 192.168.6.62:6389@16389 slave e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 0 1649931855000 3 connected
213287f2d6b5267d5ba99348075b5d9ea1fd94e9 192.168.6.62:6379@16379 slave ae24333766fccba657912796bffdbc84495be855 0 1649931855000 7 connected
eaf74d52af2c414345348dc8f0a880ec95116d05 192.168.6.62:6391@16391 slave c9f131ce057d662acf22955e8acc0309c32b7a52 0 1649931857083 2 connected
c9f131ce057d662acf22955e8acc0309c32b7a52 192.168.6.62:6380@16380 myself,master - 0 1649931857000 2 connected 5461-10922
e754a2c27a735d80dd4367d31be0f2e7ee6b9cfa 192.168.6.62:6381@16381 master - 0 1649931855071 3 connected 10923-16383
ae24333766fccba657912796bffdbc84495be855 192.168.6.62:6390@16390 master - 0 1649931856077 7 connected 0-5460
如果所有某一段插槽的主从节点都宕掉,redis服务是否还能继续?
如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为yes ,那么 ,整个集群都挂掉
如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为no ,那么,该插槽数据全都不能使用,也无法存储。
redis.conf中的参数 cluster-require-full-coverage
13、集群的Jedis开发
即使连接的不是主机,集群会自动切换主机存储。主机写,从机读。
无中心化主从集群。无论从哪台主机写的数据,其他主机上都能读到数据。
public class JedisClusterTest {
public static void main(String[] args) {
Set<HostAndPort>set =new HashSet<HostAndPort>();
// url任意即可
set.add(new HostAndPort("192.168.6.62",6379));
JedisCluster jedisCluster=new JedisCluster(set);
jedisCluster.set("k1", "v1");
System.out.println(jedisCluster.get("k1"));
}
}
14、Redis 集群提供了以下好处
实现扩容
分摊压力
无中心配置相对简单
15、Redis 集群的不足
多键操作是不被支持的
多键的Redis事务是不被支持的。lua脚本不被支持
由于集群方案出现较晚,很多公司已经采用了其他的集群方案,而代理或者客户端分片的方案想要迁移至redis cluster,需要整体迁移而不是逐步过渡,复杂度较大。