大话数据结构读书笔记系列(二)算法

第2章 算法

算法

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作

算法设计的要求:应该具有正确性。可读性、健壮性、高效率和低存储量的特征。

2.3 两种算法的比较

大家都已经学过一门计算机语言,不管学的是哪一种,学得好不好,好歹是可以写点小程序了。现在我要求你写一个求 1+2+3+...+100结果的程序,你应该怎么写呢?

大多数人会马上写出下面的C语言代码(或者其他语言的代码):

    int i, sum=0, n=100;
    for (int i=1; i<=n; i++){
        sum += i;
    }
    print("%d",sum);

这是最简单的计算机程序之一,它就是一种算法,我不去解释着代码的含义了。问题在于,你的第一直觉是这样写的,单这样是不是真的很好?是不是最高效?

而高斯的解法是: 输入图片说明

用程序来实现如下: 输入图片说明

神童就是神童,他用的方法相当于另一种求等差数列的算法,不仅仅可以用于1加到100,就是加到一千、一万、一亿(需要更改整型变量类型为长整型,否则会溢出),也就是瞬间之事。单如果用刚才的程序,显然计算机要循环一千、一万、一亿次的加法运算。人脑比电脑算得快,似乎成为了现实。

2.5 算法的特性

算法具有五个基本特性:输入、输出、有穷性,确定性和可行性。

2.5.1 输入输出

输入和输出特性比较容易理解,算法具有零个或多个输入。尽管对于绝大多数算法来说,输入参数都是必要的,但对于个别情况,如打印"hello word!"这样的代码,不需要任何输入参数,因此算法的输入可以是零个算法至少有一个或多个输出,算法是一定需要输出的,不需要输出,你用这个算法干吗?输出的形式可以是打印输出,也可以是返回一个或多个值等。

2.5.2 有穷性

**有穷性:指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。**现实中经常会写出死循环的代码,这就是不满足有穷性。当然这里有穷的概念并不是纯数学意义的,而是在实际应用当中合理的、可以接受的"有边界"。你说你写一个算法,计算机需要算上个二十年,一定会结束,它在数学意义上是有穷了,可以媳妇都熬成婆了,算法的意义也就不大了。

2.5.3 确定性

**确定性:算法的每一步骤都具有确定的含义,不会出现二义性。**算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果。算法的每个步骤被精确定义而无歧义。

2.5.4 可行性

**可行性:算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成。**可行性意味着算法可以转换为程序上机运行,并得到正确的结果。尽管目前计算机界也存在那种没有实现的极为复杂的算法,不是说理论上不能实现,而是因为过于复杂,我们当前的编程方法、工具和大脑限制了这个工作,不过这都是理论研究领域的问题,不属于我们现在要考虑的范围。

2.6 算法设计的要求

2.6.1 正确性

正确性:算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性,能正确反映问题的需求、能够得到问题的正确答案。

但是算法的"正确"通常在用法上有很大的差别,大体分为以下四个层次。

  1. 算法程序没有语法错误。
  2. 算法程序对合法的输入数据能够产生满足要求的输出结果。
  3. 算法程序对于非法的输入数据能够得出满足规格说明的结果。
  4. 算法程序对于精心选择的,甚至刁难的测试数据都有满足要求的输出结果。

对于这四层含义,层次1要求最低,但是仅仅没有语法错误实在谈不上是好算法。这就如同仅仅解决温饱,不能算是生活幸福一样。而层次4是最困难的,我们几乎不可能逐一验证所有的输入都得到正确的结果。

因此算法的正确性在大多数情况下都不可能用程序来证明,而是用数学方法证明的。证明一个复杂算法在所有层次上都是正确的,代价非常昂贵。所以一般情况下,我们把层次3作为一个算法是否正确的标准。

好算法还有什么特征呢?

2.6.2 可读性

可读性:算法设计的另一目的是为了便于阅读、理解和交流。

2.6.3 健壮性

健壮性:当输入数据不合法时,算法也能做出相关处理,而不是产生异常或莫名其妙的结果。

2.6.4 时间效率高和存储量低

时间效率指的是算法的执行时间,对于同一个问题,如果有多个算法能够解决,执行时间短的算法效率高,执行时间长的效率低。存储量需求指的是算法在执行过程中需要的最大存储空间,主要指算法程序运行时所占用的内存或外部硬盘存储空间。设计算法应该尽量满足时间效率高和存储量低的需求。在生活中,人们都希望花最少的钱,用最短的时间,办最大的事,算法也是一样的思想,最好用最少的存储空间,花最少的时间,办成统一的事就是好的算法。

2.7 算法效率的度量方法

2.7.1 事后统计方法

事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法的效率的高低。

但是这种方法显然是有很大缺陷的:

  • 必须依据算法事先编制好程序,这通常需要花费大量的时间和精力。如果编制出来发现它根本是很糟糕的算法,不是竹篮打水一场空吗
  • 时间的比较依赖计算机硬件和软件等环境因素,有时会掩盖算法本身的优劣。要知道,现在的一台四核处理器的计算机,跟当年286、386/486等老爷爷辈的机器相比,在处理算法的运算速度上,是不能相提并论的;而所用的操作系统、编译器、运行框架等软件的不同,也可以影响它们的结果;就算是同一台机器,CPU使用率和内存占用情况不一样,也会造成细微的差异。
  • 算法的测试数据设计困难,并且程序的运行时间往往还与测试数据的规模有很大关系,效率高的算法在小的测试数据面前往往得不到体现。比如10个数字的排序,不管用什么算法,差异几乎是零、而如果有一百万个随机数字排序,那不同算法的差异就非常大了。那么我们为了比较算法,到底用多少数据来测试,这是很难判断的问题。

基于事后统计方法有这样那样的缺陷,我们考虑不予采纳。

2.7.2 事前分析估算方法

事前分析估算方法:在计算机程序编制前,依据统计方法对算法进行估算。 抛开这些与计算机硬件、软件有关的因素。一个程序的运行时间,依赖于算法的好坏和问题的输入规模。所谓问题输入规模是指输入量的多少。

我们来看看今天刚上课时举的例子,两种求和的算法: 输入图片说明 显然,第一种算法,执行了1+(n+1)+n+1次=2n+3次;而第二种算法,是1+1+1=3次。事实上两个算法的第一条和最后一条语句是一样的,所以我们关注的代码其实是中间那部分,我们把循环看作一个整体,忽略头尾循环判断的开销,那么这两个算法其实就是n次和1次的差距。算法好坏显而易见。

我们再来延伸一下上面这个例子: 输入图片说明 这个例子中,i从1到100,每次都要让j循环100次,而当中的x++和sum=sum+x;其实就是1+2+3+...+10000,也就是100的平方次,所以这个算法当中,循环部分的代码整体需要执行n的平方(忽略循环体头尾的开销)次。显然这个算法的执行次数对于同样的输入规模n=100,要多于前面两种算法,这个算法的执行时间随着n的增加也将远远多于前面两个。

此时你会看到,测定运行时间最可靠的方法就是计算对运行时间有消耗的基本操作的执行次数。运行时间和这个计数成正比。

我们不关心编写程序所用的程序设计语言是什么,也不关心这些程序将跑在什么样的计算机中,我们只关心它所实现的算法。这样,不计那些循环索引的递增和循环终止条件、变量声明、打印结果等操作,最终,在分析程序的运行时间时,最重要是把程序看成是独立于程序设计语言的算法或一系列步骤

2.8 函数的渐近增长

某个算法,随着n的增长,它会越来越优于另一算法,或者越来越差于另一算法。这其实就是事前估算方法的理论依据通过算法时间复杂度来估算算法时间效率

2.9 算法时间复杂度

在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进行分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。

2.9.2 推导大O阶方法

  1. 用常数1取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果最高阶项存在且不是1,则去除与这个项相乘的常数。得到的结果就是大O阶。

我们要分析算法的复杂度,关键就是要分析循环结构的运行情况

2.9.3 常数阶

首先顺序结构的时间复杂度。下面这个算法,也就是刚才的第二种算法(高斯算法),为什么时间复杂度不是O(3),而是O(1)。 输入图片说明 这个算法的运行次数函数是f(n)=3.根据我们推到大O阶的方法,第一步就是把常数项3改为1.在保留最高阶项时发现,它根本没有最高阶项,所以这个算法的时间复杂度为O(1)。

另外,我们试想一下,如果这个算法当中的语句 sum=(1+n)*n/2有10句,即: 输入图片说明

事实上无论n为多少,上面的两段代码就是3次和12次执行的差异。这种与问题的大小无关(n的多少),执行时间恒定的算法,我们称之为具有O(1)的时间复杂度,又叫常数阶

注意:不管这个常数是多少,我们都记作O(1),而不能是O(3)、O(12)等其他任何数字,这是初学者常常犯的错误。

对于分支结构而言,无论是真,还是假,执行的次数都是恒定的,不会随着n的变大而发生变化,所以单纯的分支结构(不包含在循环结构中),其时间复杂度也是O(1)

2.9.4 线性阶

线性阶的循环结构会复杂很多。要确定某个算法的阶次,我们常常需要确定某个特定语句或某个语句集运行的次数。因此,我们要分析算法的复杂度,关键就是要分析循环结构的运行情况

下面这段代码,它的循环的时间复杂度为O(n),因为循环体中的代码需要执行n次。 输入图片说明

2.9.5 对数阶

下面的这段代码,时间复杂度又是多少呢? 输入图片说明 由于每次count乘以2以后,就距离n更近了一分。也就是说,有多少个2相乘后大于n,则会退出循环。由2^x=n得到x=log2n。所以这个循环的时间复杂度为O(logn)。

2.9.6 平方阶

下面例子是一个循环嵌套,它的内循环刚才我们已经分析过,时间复杂度为O(n)。 输入图片说明 而对于外层的循环,不过是内部这个时间复杂度为O(n)的语句,再循环n次。所以这段代码的时间复杂度为O(n^2)。

如果外循环的循环次数改为了m,时间复杂度就变为O(m*n)。 输入图片说明 所以我们可以总结得出,循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

那么下面这个循环嵌套,它的时间复杂度是多少呢? 输入图片说明 由于当i=0时,内循环执行了n次,当i=1时,执行了n-1次,...当i=n-1时,执行了1次。所以总的执行次数为: 输入图片说明 用我们推导大O阶的方法,第一条,没有加法常数不予考虑;第二条,只保留最高阶项,因此保留n^2/2;第三条,去除这个项相乘的常数,也就是去除1/2,最终这段代码的时间复杂度为O(n^2)。

从这个例子,我们也可以得到一个经验,其实理解大O推导不算难,难的是对数列的一些相关运算,这更多的是考察你的数学知识和能力,所以想考研的朋友,要想在求算法时间复杂度这里不失分,可能需要强化你的数学,特别是数列方面的知识和解题能力。

我们继续看例子,对于方法调用的时间复杂度又如何分析。 输入图片说明 上面这段代码调用一个函数function。 输入图片说明 函数体是打印这个参数。其实这很好理解,function函数的时间复杂度是O(1)。所以整体的时间复杂度为O(n)。

假如function是下面这样的: 输入图片说明 事实上,这和刚才举的例子是一样的,只不过把嵌套内循环放到了函数中,所以最终的时间复杂度为O(n^2)。

下面这段相对复杂的语句: 输入图片说明 它的执行次数输入图片说明 根据推导大O阶的方法,最终这段代码的时间复杂度也是O(n^2)。

2.10 常见的时间复杂度

常见的时间复杂度如表2-10-1所示。 输入图片说明 常用的时间复杂度所耗费的时间从小到大依次是:输入图片说明]

我们前面已经谈到了O(1)常数阶、O(logn)对数阶、O(n)线性阶、O(n^2)平方阶等,至于O(nlogn)我们将会在今后的课程中介绍,而像O(n^3),过大的n都会使得结果变得不现实。同样指数阶O(2^n)和阶乘O(n!)等除非是很小的n值,否则哪怕n只是100,都是噩梦般的运行时间。所以这种不切实际的算法时间复杂度,一般我们都不去讨论它。

2.11 最坏情况与平均情况

你早晨上班出门后突然想起来,手机忘记带了,这年头,钥匙、钱包、手机三大件,出门哪样也不能少呀。于是回家找。打开门一看,手机就在门口玄关的台子上,原来是出门穿鞋时忘记拿了。这当然是比较好,基本没花什么时间寻找。可如果不是放在那里,你就得进去到处找,找完客厅找卧室、找完卧室找厨房、找完厨房找卫生间,就是找不到,时间一分一秒的过去,你突然想起来,可以用家里座机打一下手机,听着手机铃声来找呀,真是笨。终于找到了,在床上枕头下面。你再去上班,迟到。见鬼,这一年的全勤奖,就因为找手机给黄了。

找东西有运气好的时候,也有怎么也找不到的情况。但在现实中,通常我们碰到的绝大多数既不是最好的也不是最坏的,所以算下来是平均情况居多

2.12 算法空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记为:S(n)=O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。

猜你喜欢

转载自my.oschina.net/u/2484728/blog/1802980