昊鼎王五:mongodb的副本集与分片的对比?
本文基于:《昊鼎王五:linux(centos7)如何七分钟搭建mongodb集群服务器?》
https://blog.csdn.net/haoding205/article/details/82253048
高可用分片集群架构图
1.分片与复制集对比
1.1 、shard片区
每个shard 片区都是一个副本集(Replica Set) 每个片区都有一个主的服务可以写入还有N个副本的数据备份,几个片区的数据加起来就一个完整的数据集
1.2、config配置服务
配置服务器相当于集群的大脑,保存着集群和分片的配置信息。因此,应该首先建立配置服务器,鉴于它所包含的的数据极端重要性,必须启用其日志功能,并确保其数据保存在非易失性驱动器上。每个配置服务器都应该位于单独的物理机上,最好是分布在不同地址位置的机器上。(注:在测试环境上配置服务可以开一个,但是在生产环境,则要开3个或以上。如:一个数据中心,数据分布在,北京、上海、广州,则在每个区域都需要启动一个配置服务)
1.3、mongos路由服务
相当于进入集群的一个路由器、可以启动任意数量的mongos进程。其职责是隐藏分片内部的复杂性并向用户提供一个简洁的单服务器接口。ssssss通常的设置时每个应用程序服务器使用一个mongos进程(与应用服务器运行在同一台机器上)
Mongo中对数据的分割
Mongodb使用基于区间的方法来划分片区如下
Mongo中多以[a,b)来表示区间范围
假如我们有四个分片区以用户名做为片键,用户名都以”a” 到 “z”之间的字母开头,其可表示的区间范围为[a, }),} 是ASCII码表中字母z后面的字符。分区大致如下图
2.片键选择
拆分数据最常用的数据分发方式有三种:升序片键、随机分发的片键和基于位置的片键。
2.1.升序片键:升序片键通常有点类似于”date”字段或者是ObjectId,是一种随着时间稳定增长的字段。缺点:例如ObjectId可能会导致接下来的所有的写入操作都在同一块分片上。
如:db.runCommand( { shardcollection : "dydb.user ",key : {_id : 1} } )
2.2.随机分发的片键:随机分发的片键可以是用户名,邮件地址,UDID,MD5散列值或者数据集中其他一些没有规律的键。缺点:MongoDB在随机访问超出RAM大小的数据时效率不高。
如:db.runCommand( { shardcollection : "dydb.user ",key : {username : 1} } )
2.3.基于位置的片键:基于位置的片键可以是用户的IP、经纬度、或者地址。这里的”位置”比较抽象,不必与实际的物理位置字段相关。
如果希望特定范围内的块出现在特定的分片中,可以为分片添加tag,然后为块指定相应的tag
如:
1、为分片指定tag:sh.addShardTag('shardName','tagName')
mongos> sh.addShardTag("mablevi","AAA")
mongos> sh.addShardTag("shard0000","BBB")
2、为tag指定规则:sh.addTagRange('库.集合',{minkey:num},{maxkey:num},tagName)
mongos> sh.addTagRange("abc.number",{"num":0},{"num":20},"AAA")
mongos> sh.addTagRange("abc.number",{"num":21},{"num":50},"BBB")
(1和2的意思是把分片mablevi、shard000指定AAA、BBB标签。并且0到20的数据写到AAA标签里,21到50的数据写到BBB标签里。其他范围的数据也可以写进)
3、删除分片
use admin
db.runCommand({"removeshard" : "s3"});
2.4.片键规则和指导方针:
1、 片键限制:片键不可以是数组。文档一旦插入,其片键就无法修改了。要修改文档的片键值,就必须先删除文档。
2、 片键的势:选择一个值会变化的的键非常重要,即值很多,随着数据量的增大可以分出更多的片键。分片在势比较高的字段上性能更佳。
数据均衡:
1、均衡器:均衡器只使用块的数量,而非数据大小,作为衡量分片间是否均衡的指标。自动均衡总是根据数据集的当前状态来决定数据迁移,而不考虑数据集历史状态。我们可以手动均衡数据集块的数量。
2、修改块的大小:块的大小默认为64M,这个大小的块既易于迁移,又不至于导致过多的流失。使用shell连接到mongos,修改config.setting集合,从而完成块大小的修改。
如果MongoDB频繁进行数据迁移或文档增大,则可能需要增加块的大小。
3、迁移块:同一块内的所有数据都位于同一分片上。如该分片的块数量比其他分片多,则MongoDB会将其中的一部分块迁移到其他块数量较少的分片上。移动快的过程叫迁移,MongoDB就是这样在集群中
3.其他命令:
3.1如何查看shard信息
登上mongos
sh.status()或者需要看详细一点
sh.status({verbose:true})
use config
db.settings.save( { _id:"chunksize", value: 1024} )
db.settings.save( { _id:"chunksize", value: 512} )
3.2释放空间
db.repairDatabase()
3.3主从切换
rs.stepDown([secs])
3.4停止服务
kill pid
db.shutdownServer()
db.adminCommand('shutdown':1)
3.5均衡器管理
db.locks.findOne({'_id':'balancer'})
db.settings.find({'_id':'balancer'})
sh.getBalancerState()
sh.setBalancerState(true)
sh.setBalancerState(false)
db.settings.update({ _id : "balancer" }, { $set : { activeWindow : { start : "23:00", stop : "6:00" } } }, true )
3.6可以通过下面的方式查看当前是否有迁移在进行:
while(db.locks.findOne({'_id':'balancer'}).state){print('wating...');sleep(1000)}
3.7查看复制集
db.printReplicationInfo()
db.printSlaveReplicationInfo()
好了,聪明如你,知道了mongodb的副本集与分片的对比,是不是很欢喜 ^_^
还有其他问题的可以在评论区留言或者扫码加博主获取资源或者提问。