根据数据量的大小 可将查找分为内部查找和外部查找
内部查找:数据量较小的文件可以一次性全部加载到内存中进行查找
外部查找:数据量较大的文件无法一次性加载到内存中处理,需要使用辅助存储器来分次处理
注意:我们根据在查找过程中查找的文件是否改动,将查找分为静态查找和动态查找
顺序查找
顺序查找是一种线性查找,最简单的查找方式。逐个遍历,最坏的情况下,时间复杂度为O(n)
示例代码
def orderSearch(num):
import random
count = 0
# data = [0] * 8
# for i in range(8):
# data[i] = random.randint(1, 100)
data = [1, 2, 3, 4, 5, 6, 7, 8]
for i in range(len(data)):
count += 1
if data[i] == num:
print("找到{0}了,在数组data的第{1}个位置,查找了{2}次".format(num, i, count))
break
else:
print("找了{0}次,没找到".format(count))
orderSearch(10)
二分查找法
前提是数据已经是有序的状态,将数据分割成两等份,再比较键值与中间值的大小,如果键值小于中间值,确定查找的数据在前半段否则在后半段。时间复杂度为O(logn)
def binSearch(data, val):
low = 0
high = len(data) - 1
while low <= high and val != -1:
mid = int((low + high) / 2)
if val < data[mid]:
high = mid - 1
elif val > data[mid]:
low = mid + 1
else:
return mid
return -1
def binary_search(alist, item):
"""
(递归实现)
:param alist:
:param item:
:return:
"""
if len(alist) == 0:
return False
else:
midpoint = len(alist) // 2
if alist[midpoint] == item:
return True
else:
if item < alist[midpoint]:
return binary_search(alist[:midpoint], item)
else:
return binary_search(alist[midpoint + 1:], item)
print(binSearch([1, 2, 3, 4, 5, 6, 7, 8], 3))
插值查找法
它是二分查找法的改进版,按照数据位置的分布,利用公式预测数据所在的位置,再利用二分法方式渐渐逼近