1、無(wú)中心化
- Redis Cluster采用無(wú)中心架構(gòu),每個(gè)節(jié)點(diǎn)都保存數(shù)據(jù)和整個(gè)集群的節(jié)點(diǎn)狀態(tài)
- 每個(gè)節(jié)點(diǎn)都和集群中的其它節(jié)點(diǎn)保持連接
- 使用gossip協(xié)議傳播信息以及發(fā)現(xiàn)新的節(jié)點(diǎn)
- 節(jié)點(diǎn)不作為client請(qǐng)求的代理,client應(yīng)該根據(jù)節(jié)點(diǎn)返回的錯(cuò)誤信息重定向到目標(biāo)client
2、數(shù)據(jù)分布(slot)
redis預(yù)設(shè)16384個(gè)slot(槽),集群中的每個(gè)master節(jié)點(diǎn)負(fù)責(zé)分管一部份slot,保存數(shù)據(jù)時(shí),根據(jù)CRC16(key) mod 16384的值,決定將一個(gè)key放到哪個(gè)槽中,從而定位由哪個(gè)redis實(shí)例存儲(chǔ)。當(dāng)發(fā)生Redis節(jié)點(diǎn)增減時(shí),調(diào)整桶的分布即可,實(shí)現(xiàn)了集群的動(dòng)態(tài)擴(kuò)容功能。同時(shí)也間接的說(shuō)明redis集群最多只能有16384個(gè)節(jié)點(diǎn)。
例如:假設(shè)Redis集群有三個(gè)節(jié)點(diǎn)A/B/C,在開(kāi)始創(chuàng)建的時(shí)候,集群中節(jié)點(diǎn)槽的分配如下:
Node A 分管slot的編號(hào)為:0 ~ 5460
Node B 分管slot的編號(hào)為:5461 ~ 10922
Node C 分管slot的編號(hào)為:10923 ~ 16383
當(dāng)添加一個(gè)新的master節(jié)點(diǎn)D,假設(shè)為它分配900個(gè)slot,你可以從節(jié)點(diǎn)ABC三中各取300個(gè)分配給D,也可指定從A或B或C中移出900個(gè)slot分配給D,或選其中幾個(gè)節(jié)點(diǎn)中各取一部份湊夠900個(gè)分配給D即可。同樣的,如果要將D節(jié)點(diǎn)移除,需要先將D節(jié)點(diǎn)分管的slot全部分配到其它master節(jié)點(diǎn)后才能移除,否則有無(wú)效的slot,集群將無(wú)法服務(wù)。
3、可用性:Master-Slave
- 為了保證服務(wù)的可用性,Redis Cluster采取的方案是Master-Slave機(jī)制
- 每個(gè)Redis Master Node可以有一個(gè)或者多個(gè)Slave Node。當(dāng)Master Node掛掉時(shí),會(huì)從Slave Node中選一個(gè)新的Master
- 每個(gè)Master Node都負(fù)責(zé)分管一定范圍的slot,當(dāng)這些slot對(duì)應(yīng)的Master和Slave都掛掉時(shí),這部份slot對(duì)應(yīng)的數(shù)據(jù)將不可用
- 16384個(gè)slot必須被全部分配,否則集群將不可用。通過(guò)
cluster info
查看集群狀態(tài)可以得知。
4、寫(xiě)
Redis Cluster采用異步復(fù)制機(jī)制
一個(gè)完整的寫(xiě)操作步聚:
1. client寫(xiě)數(shù)據(jù)到master
2. master回復(fù)client “OK”
3. master將數(shù)據(jù)傳播更新到slave
存在數(shù)據(jù)丟失的風(fēng)險(xiǎn):
1. 上述步聚1)和2)成功后,如果此時(shí)master crash,而數(shù)據(jù)還沒(méi)有傳播到slave。此時(shí)slave選主為master,但那部份數(shù)據(jù)可能就被丟失了。
2. 由于分區(qū)導(dǎo)致同時(shí)存在兩個(gè)master,client向舊的master寫(xiě)入了數(shù)據(jù)
當(dāng)然,由于Redis Cluster存在超時(shí)及故障恢復(fù)機(jī)制,第2個(gè)風(fēng)險(xiǎn)基本上可以忽略不計(jì)
5、數(shù)據(jù)遷移
Redis Cluster支持在線增、減節(jié)點(diǎn)?;趕lot的數(shù)據(jù)分布方式大大降低了遷移成本,只需將數(shù)據(jù)slot從一個(gè)redis node遷移到另一個(gè)redis node即可完成遷移工作 。
當(dāng)slot從一個(gè)Node A向另一個(gè)Node B遷移時(shí),Node A和Node B都會(huì)有這個(gè)slot,Node A上slot的狀態(tài)設(shè)置為MIGRATING,Node B上的狀態(tài)被設(shè)置為IMPORTING。此時(shí)當(dāng)客戶(hù)端請(qǐng)求時(shí),所有key在Node A上的請(qǐng)求都由A來(lái)處理,所有不在A上的key都由Node B來(lái)處理。同時(shí),Node A上將不會(huì)創(chuàng)建新的key。
6、客戶(hù)端操作的一些缺陷
- 不支持多數(shù)據(jù)庫(kù),默認(rèn)只有一個(gè)0號(hào)db,select 0
- cluster環(huán)境下slave默認(rèn)不接受任何讀寫(xiě)操作,在slave執(zhí)行readonly命令后,可執(zhí)行讀操作。執(zhí)行readwrite命令后,可執(zhí)行讀寫(xiě)操作。
- client端不支持多key操作(mget,mset等),但當(dāng)keys集合對(duì)應(yīng)的slot相同時(shí)支持mget操作。