DynamoDB的分区与存储的坑

DynamoDB的分区如何计算呢？直接上公式：

实际设置的读容量／最大读支持3000 + 实际设置的写容量／最大写支持1000 所得结果想上取整。

即：(readCapacityUnits / 3000) + (writeCapacityUnits / 1000) = RoundUp(initPartitions).

比如实际设置了1000个读和500个写，那么

(1000 / 3000 ) + ( 500 / 1000) = RoundUp(5/6) = 1。

所以分区的初始值就为1。

必要的时候，DynamoDB会自动拆分现有的分区，提供更多的分区以支撑吞吐。

单个分区可以保存10G的数据，当数据由于写入不均衡时，可能造成某些分区超过存储限制10G，这时DynamoDB将会拆分分区。

其具体步骤为：

扫描二维码关注公众号，回复： 43185 查看本文章

什么时候会执行拆分呢？当吞吐量设置增加，存储要求提高时，都会触发DynamoDB的拆分区操作。

1. 如果当前表分区不能满足新的预置吞吐量时，DynamoDB将会将当前的分区数量扩充一倍。

比如当前读容量为5000，写容量为2000时，DynamoDB设置的分区数为：( 5000 / 3000) + (2000 / 1000) = 3.667 -> 4。

如果将读容量从5000调整到8000时，按分区计算公式：[(8000/3000)+(2000/1000)->5]。 4个分区就不能满足了，DynamoDB就会将分区数据量翻倍。如下图所示：

2. 如果某个分区的数据量超过了限制10G，DynamoDB将会把这个分区拆成两个，并且数据将会平均分配到两个新的分区中。如图所示：

上图红框分区填满后，DynamoDB的策略将会把该分区拆除两个分区，拆之前的容量大小为80G，拆后的总容量大小为90G。

这里会有一个坑：

DynamoDB拆分出的分区只会共享原分区的读写吞吐。比如：

开始的时候创建5000读和2000写，DynamoDB会创建4个分区：( 5000 / 3000) + (2000 / 1000) = 3.667 -> 4。

每个分区的读写容量为：

5000/4 partitions = 1250

2000/4 partitions = 500

当一个分区拆分成两个分区以后，读写将会被平分：

1250 ／ 2 = 625 读

500 ／ 2 = 250 写。

如果分区键没有打散造成分区写入偏移，就会造成DynamoDB创建出过多的分区，这样随着DynamoDB拆分，实际上每个分区可用的读写容量会越来越少。会导致性能的严重下降。