玩转数据结构之最好、最坏、平均时间复杂度

0.序言

这篇文章讲解三个复杂度分析方面的知识点:

  • 最好情况时间复杂度
  • 最坏情况时间复杂度
  • 平均情况时间复杂度

如果你对简单的复杂度分析还不了解,建议点击跳转阅读这两篇文章:
https://www.jianshu.com/p/2d5e5f1bc77e
https://www.jianshu.com/p/4c8fa84a9393

1. 最好、最坏时间复杂度

// n 表示数组 array 的长度
int find(int[] array, int n, int x) {
  int i = 0;
  int pos = -1;
  for (; i < n; ++i) {
    if (array[i] == x) {
       pos = i;
       break;
    }
  }
  return pos;
}

这段代码要是实现的功能是:在一个无序的数组中,查找变量x出现的位置。如果没有找到,就返回-1。如果数组中第一个元素正好是要查找的变量x,那就不需要继续遍历剩下的n-1个数据了,时间复杂度就是O(1)。如果数组中不存在变量x,就需要把整个数组遍历一遍,时间复杂度就成了O(n)。所以在不同的情况下,这段代码的时间复杂度不一样。

为了表示代码在不同情况下的不同时间复杂度,需要引入三个概念

  • 最好情况时间复杂度
    顾名思义:指的是在最理想的情况下,执行这段代码的时间复杂度。对应以上例子:要查找的变量x,正好是数组的第一个元素。这个时候对应的时间复杂度就是最好情况时间复杂度。
  • 最坏情况时间复杂度
    顾名思义:指的是在最糟糕的情况下,执行这段代码的时间复杂度。对应以上例子:要查找变量x,但数组中没有变量x,需要把整个数组都遍历一遍。这个时候对应的时间复杂度就是最坏情况时间复杂度。
  • 平均情况时间复杂度
    请看下一小节。

2. 平均时间复杂度

最好情况时间复杂度和最坏情况时间复杂度对应的都是比较极端的情况,发生的概率比较小。为了更好地表示平均情况下的时间复杂度,我们引入"平均时间复杂度"这个概念。

借助刚才查找变量x的例子:要查找的变量x在数组中的位置,有n+1种情况:在数组的0~n-1位置中和不在数组中。把每种情况下,查找需要遍历的元素个数累加起来,然后再除以n+1,就可以得到需要遍历的元素个数的平均值,即:


3383952-aff59da7b5b1c517.jpeg
平均时间复杂度(1)

大O时间复杂度表示法,可以忽略系数、低阶、常量,所以这个公式可以简化为O(n)。不过计算过程有点问题,就是我们刚才说的这个n+1种情况,出现的概率其实是不一样的。

要查找变量x,在数组和不在数组的概率都是1/2,在0~n-1这个n个位置的概率也是一样的,为1/n,而根据时间复杂度乘法法则(嵌套代码复杂度是嵌套内外代码复杂度的乘积)【如果对时间复杂度乘法法则不了解,建议点击跳转阅读这篇文章:https://www.jianshu.com/p/2d5e5f1bc77e 】,要查找的数据出现在0~n-1中任意位置的概率就是1/n * 1/2 = 1/2n。所以如果把每种情况发生的概率考虑进去,那么平均时间复杂度的计算过程就变成了这样:

3383952-cc72f0761110ff3a.jpg
平均时间复杂度(2)

这个值在概率论中叫做加权平均值,也叫做期望值,所以平均时间复杂度的全程应该叫加权平均时间复杂度或者期望时间复杂度。

用大O时间复杂度表示法表示,去掉系数和常量,上面示例代码的加权时间复杂度依然是O(n)。

其实,在大多数情况下,并不需要区分最好、最坏、平均情况时间复杂度三种情况,很多时候,只需要使用一个复杂度就可以满足需求,就像以下两篇文章中所讲的那样:
https://www.jianshu.com/p/2d5e5f1bc77e
https://www.jianshu.com/p/4c8fa84a9393
只有同一块代码在不同的情况下,时间复杂度有量级的差距,我们才会使用三种复杂度表示法来区分。

那何时平均时间复杂度加权,何时不加权呢?针对每个操作发生的概率都一样的情况下,没有必要使用加权平均时间复杂度,针对每个操作发生的概率不一样的情况下,有必要使用加权平均时间复杂度。

3. 后续

如果大家喜欢这篇文章,欢迎点赞!
如果想看更多 数据结构 方面的文章,欢迎关注!

猜你喜欢

转载自blog.csdn.net/weixin_33871366/article/details/87289846