1、梳排序、希尔排序、Timsort
梳排序(Comb sort)是一种不稳定排序算法,改良自冒泡排序,其要旨在于消除乌龟,亦即在阵列尾部的小数值,这些数值是造成冒泡排序缓慢的主因。相对地,兔子,亦即在阵列前端的大数值,不影响冒泡排序的效能。
在冒泡排序中,只比较阵列中相邻的二项,即比较的二项的间距(Gap)是1,梳排序提出此间距其实可大于1,改自插入排序的希尔排序同样提出相同观点。梳排序中,开始时的间距设定为阵列长度,并在循环中以固定比率递减,通常递减率设定为1.3。在一次循环中,梳排序如同冒泡排序一样把阵列从首到尾扫描一次,比较及交换两项,不同的是两项的间距不固定于1。如果间距递减至1,梳排序假定输入阵列大致排序好,并以冒泡排序作最后检查及修正。
递减率的设定影响着梳排序的效率,原作者以随机数作实验,得到最有效递减率为1.3的。如果此比率太小,则导致一循环中有过多的比较,如果比率太大,则未能有效消除阵列中的乌龟。亦有人提议用
Timsort是结合了归并排序和插入排序的混合排序算法,虽然插入排序的时间复杂度要高于归并排序,但当待排序列非常短时,比较时间复杂度意义不大。Timsort 的大致思想是先采用插入排序将非常短的小段扩充为较长的小段,再采用归并排序来合并多个较长的小段,具体来说,我们需要定义一个参数minrun,当小段长度小于minrun时,我们认为它是非常小的小段,否则认为它是较长的小段。
2、一致性哈希解决负载均衡问题
使用多台服务器处理请求时,一个基本问题是如何分配请求,可以将服务器编号,然后计算请求的哈希值,对服务器数量N取模,均匀地将任务分配到各台服务器上。
当服务器数量出现变化时,如果很多请求都更换服务器,会造成大量的数据迁移,给后端数据库和硬盘带来压力。理想情况是,将服务器数量从N变为N-1时,只会导致1/(N-1)的请求更换服务器,将服务器数量从N变为N+1时,只会导致1/(N+1)的请求更换服务器。
一致性哈希可以解决这个问题:选择两个合适的哈希函数,将请求和服务器都分别映射到一个区间上的整数,然后把请求和服务器都标记在一个环上。每个请求都由其顺时针方向上的第1个服务器来处理。
如果改动(增加或减少)一台服务器,只需要将一小部分请求改动给别的服务器处理
弊端:
服务器数量较少时,分布不均,会使一些服务器承担过重;
增加一台服务器时,只能减轻一台服务器的请求量,其他服务器不会改善;
减少一台服务器时,会有一台服务器承受两倍重量。
解决办法:
可以将服务器定义为多个哈希函数,并将它们全部标记在环上。这样服务器数量少时也会分布比较均匀,增加一台服务器时,新服务器会出现在环上多个位置,减少一台服务器时,请求量也会比较均匀地分担给多台服务器。