关于冒泡排序及其优化(Python实现)

什么是冒泡排序?

冒泡排序的英文Bubble Sort,是一种最基础的交换排序。

大家一定都喝过汽水,汽水中常常有许多小小的气泡,哗啦哗啦飘到上面来。这是因为组成小气泡的二氧化碳比水要轻,所以小气泡可以一点一点向上浮动。

而我们的冒泡排序之所以叫做冒泡排序,正是因为这种排序算法的每一个元素都可以像小气泡一样,根据自身大小,一点一点向着数组的一侧移动。

具体如何来移动呢?让我们来看一个栗子:

有8个数组成一个无序数列:5,8,6,3,9,2,1,7,希望从小到大排序。

按照冒泡排序的思想,我们要把相邻的元素两两比较,根据大小来交换元素的位置,过程如下:

首先让5和8比较,发现5比8要小,因此元素位置不变。

接下来让8和6比较,发现8比6要大,所以8和6交换位置。

继续让8和3比较,发现8比3要大,所以8和3交换位置。

继续让8和9比较,发现8比9要小,所以元素位置不变。

接下来让9和2比较,发现9比2要大,所以9和2交换位置。

接下来让9和1比较,发现9比1要大,所以9和1交换位置。

最后让9和7比较,发现9比7要大,所以9和7交换位置。

这样一来,元素9作为数列的最大元素,就像是汽水里的小气泡一样漂啊漂,漂到了最右侧。

这时候,我们的冒泡排序的第一轮结束了。数列最右侧的元素9可以认为是一个有序区域,有序区域目前只有一个元素。

下面,让我们来进行第二轮排序:
首先让5和6比较,发现5比6要小,因此元素位置不变。

接下来让6和3比较,发现6比3要大,所以6和3交换位置。

继续让6和8比较,发现6比8要小,因此元素位置不变。

接下来让8和2比较,发现8比2要大,所以8和2交换位置。

接下来让8和1比较,发现8比1要大,所以8和1交换位置。

继续让8和7比较,发现8比7要大,所以8和7交换位置。

第二轮排序结束后,我们数列右侧的有序区有了两个元素,顺序如下:

至于后续的交换细节,我们这里就不详细描述了,第三轮过后的状态如下:

第四轮过后状态如下:

第五轮过后状态如下:

第六轮过后状态如下:

第七轮过后状态如下(已经是有序了,所以没有改变):

第八轮过后状态如下(同样没有改变):

到此为止,所有元素都是有序的了,这就是冒泡排序的整体思路。

原始的冒泡排序是稳定排序。由于该排序算法的每一轮要遍历所有元素,轮转的次数和元素数量相当,所以时间复杂度是O(N^2) 。

冒泡排序第一版:

def bubble_sort(l):
for i in range(len(l)-2):
    for j in range(len(l)-1-i):
        if l[j] > l[j+1]:
            l[j], l[j+1] = l[j+1], l[j]

l = [5, 8, 6, 3, 9, 2, 1, 7]
bubble_sort(l)
print(l)

代码非常简单,使用双循环来进行排序。外部循环控制所有的回合,内部循环代表每一轮的冒泡处理,先进行元素比较,再进行元素交换。

原始的冒泡排序有哪些优化点呢?

让我们回顾一下刚才描述的排序细节,仍然以5,8,6,3,9,2,1,7这个数列为例,当排序算法分别执行到第六、第七、第八轮的时候,数列状态如下:

很明显可以看出,自从经过第六轮排序,整个数列已然是有序的了。可是我们的排序算法仍然“兢兢业业”地继续执行第七轮、第八轮。

这种情况下,如果我们能判断出数列已经有序,并且做出标记,剩下的几轮排序就可以不必执行,提早结束工作。

冒泡排序第二版

def bubble_sort(l):
# 做个标记
flag = True
for i in range(len(l)-2):
    for j in range(len(l)-1-i):
        if l[j] > l[j+1]:
            l[j], l[j+1] = l[j+1], l[j]
            # 如果有元素交换,则将标记修改为False
            flag = False
    # 每一轮顺序交换完毕之后,判断是否发生了元素交换
    if flag:
        # 否则证明此轮没有发生元素交换,数组本身有序,后面无需再进行排序
        break

l = [5, 8, 6, 3, 9, 2, 1, 7]
bubble_sort(l)
print(l)

这一版代码做了小小的改动,利用布尔变量flag作为标记。如果在本轮排序中,元素有交换,则说明数列无序;如果没有元素交换,说明数列已然有序,直接跳出大循环。

为了说明问题,咱们这次找一个新的数列:

这个数列的特点是前半部分(3,4,2,1)无序,后半部分(5,6,7,8)升序,并且后半部分的元素已经是数列最大值。

让我们按照冒泡排序的思路来进行排序,看一看具体效果:

第一轮

元素3和4比较,发现3小于4,所以位置不变。

元素4和2比较,发现4大于2,所以4和2交换。

元素4和1比较,发现4大于1,所以4和1交换。

元素4和5比较,发现4小于5,所以位置不变。

元素5和6比较,发现5小于6,所以位置不变。

元素6和7比较,发现6小于7,所以位置不变。

元素7和8比较,发现7小于8,所以位置不变。

第一轮结束,数列有序区包含一个元素:

第二轮

元素3和2比较,发现3大于2,所以3和2交换。

元素3和1比较,发现3大于1,所以3和1交换。

元素3和4比较,发现3小于4,所以位置不变。

元素4和5比较,发现4小于5,所以位置不变。

元素5和6比较,发现5小于6,所以位置不变。

元素6和7比较,发现6小于7,所以位置不变。

元素7和8比较,发现7小于8,所以位置不变。

第二轮结束,数列有序区包含一个元素:

这个问题的关键点在哪里呢?关键在于对数列有序区的界定。

按照现有的逻辑,有序区的长度和排序的轮数是相等的。比如第一轮排序过后的有序区长度是1,第二轮排序过后的有序区长度是2 ……

实际上,数列真正的有序区可能会大于这个长度,比如例子中仅仅第二轮,后面5个元素实际都已经属于有序区。因此后面的许多次元素比较是没有意义的。

如何避免这种情况呢?我们可以在每一轮排序的最后,记录下最后一次元素交换的位置,那个位置也就是无序数列的边界,再往后就是有序区了。

冒泡排序第三版

def bubble_sort(l):
# 做个标记
flag = True
sort_border = len(l)-1
for i in range(len(l)-2):
    for j in range(sort_border):
        if l[j] > l[j+1]:
            l[j], l[j+1] = l[j+1], l[j]
            # 如果有元素交换,则将标记修改为False
            flag = False
            # 并且记录最后一次交换元素后的下标
            sort_border = j + 1
    # 每一轮顺序交换完毕之后,判断是否发生了元素交换
    if flag:
        # 否则证明此轮没有发生元素交换,数组本身有序,后面无需再进行排序
        break

l = [5, 8, 6, 3, 9, 2, 1, 7]
bubble_sort(l)
print(l)

这一版代码中,sort_border就是无序数列的边界。每一轮排序过程中,sort_border之后的元素就完全不需要比较了,肯定是有序的。

当然,还有一种优化方法,叫做鸡尾酒排序,鸡尾酒排序等于是冒泡排序的轻微变形。不同的地方在于从低到高然后从高到低,而冒泡排序则仅从低到高去比较序列里的每个元素。他可以得到比冒泡排序稍微好一点的效能,原因是冒泡排序只从一个方向进行比对(由低到高),每次循环只移动一个项目
以序列(2,3,4,5,1)为例,鸡尾酒排序只需要访问两次(升序降序各一次 )次序列就可以完成排序,但如果使用冒泡排序则需要四次。

鸡尾酒排序:

def cocktail_sort(l):
size = len(l)
sign = 1
for i in range(size // 2):
    if sign:
        sign = 0
        for j in range(i, size - 1 - i):
            if l[j] > l[j + 1]:
                l[j], l[j + 1] = l[j + 1], l[j]
        for k in range(size - 2 - i, i, -1):
            if l[k] < l[k - 1]:
                l[k], l[k - 1] = l[k - 1], l[k]
                sign = 1
    else:
        break

l = [5, 8, 6, 3, 9, 2, 1, 7]
cocktail_sort(l)
print(l)

鸡尾酒排序最糟或是平均所花费的次数都是O(n²),但如果序列在一开始已经大部分排过序的话,会接近O(n)。

猜你喜欢

转载自blog.csdn.net/june_young_fan/article/details/81978052