Python列表和元组比较

1.列表和元组

1.1 列表和元组基本异同点

1.2 列表和元组存储方式的差异

1.3 列表和元组的性能

1.4 列表和元组的使用场景

1.5 小结

Ps：了解掌握 Python 的基本数据结构，对于学好这门语言至关重要。

1.列表和元组

1.1 列表和元组基本异同点

实际上，列表和元组，相同点都是一个可以放置任意数据类型的有序集合。

在绝大多数编程语言中，集合的数据类型必须一致。不过，对于 Python 的列表和元组来说，并无此要求，示例：

>>> a = [1, "abc", {"k1": "v1"}]
>>> a
[1, 'abc', {'k1': 'v1'}]
>>>
>>> b = (1, "abc", {"k1": "v1"})
>>> b
(1, 'abc', {'k1': 'v1'})

不同点：

列表是动态的，长度大小不固定，可以随意地增加、删减或者改变元素（mutable）。
而元组是静态的，长度大小固定，无法增加删减或者改变（immutable）。

示例：

>>> l = [1, 2, 3, 4]
>>> l[3] = 5
>>>
>>> tup = (1, 2, 3, 4)
>>> tup(3)=5
  File "<stdin>", line 1
SyntaxError: can't assign to function call

那么，如果想对已有的元组做改变该怎么办呢？只能重新开辟一块内存创建新的元组了，对于列表来说，由于其是动态的，我们只需简单地在列表末尾，加入对应元素就可以了，会修改原来列表中的元素，而不会创建新的列表。示例如下：

# 元组添加元素
>>> tup = (1, 2, 3, 4)
>>> new_tup = tup + (5,)
>>> new_tup
(1, 2, 3, 4, 5)


# 列表添加元素
>>> l = [1, 2, 3, 4]
>>> l.append(5)
>>> l
[1, 2, 3, 4, 5]

接下来我们来看一些列表和元组的基本操作和注意事项：

和其他语言不同，Python 中的列表和元组都支持负数索引，-1 表示最后一个元素。
除了基本的初始化，索引外，列表和元组都支持切片操作。
另外，列表和元组都可以随意嵌套。

l = [[1, 2, 3], [4, 5]] # 列表的每一个元素也是一个列表

tup = ((1, 2, 3), (4, 5, 6)) # 元组的每一个元素也是一个元组

两者也可以通过 list() 和 tuple() 函数相互转换：

list((1, 2, 3))
[1, 2, 3]

tuple([1, 2, 3])
(1, 2, 3)

列表和元组常用的内置函数

l = [3, 2, 3, 7, 8, 1]
l.count(3) 
2
l.index(7)
3
l.reverse()
l
[1, 8, 7, 3, 2, 3]
l.sort()
l
[1, 2, 3, 3, 7, 8]

tup = (3, 2, 3, 7, 8, 1)
tup.count(3)
2
tup.index(7)
3
list(reversed(tup))
[1, 8, 7, 3, 2, 3]
sorted(tup)
[1, 2, 3, 3, 7, 8]

简单解释：

count(item) 表示统计列表 / 元组中 item 出现的次数。
index(item) 表示返回列表 / 元组中 item 第一次出现的索引。
list.reverse() 和 list.sort() 分别表示原地倒转列表和排序（注意，元组没有内置的这两个函数)。
reversed() 和 sorted() 同样表示对列表 / 元组进行倒转和排序，reversed() 返回一个倒转后的迭代器（上文例子使用 list() 函数再将其转换为列表）；sorted() 返回排好序的新列表。

1.2 列表和元组存储方式的差异

列表和元组最重要的区别就是，列表是动态的、可变的，而元组是静态的、不可变的。这样的差异，势必会影响两者存储方式。我们可以来看下面的例子：

>>> l = [1, 2, 3]
>>> l.__sizeof__()
64
>>>
>>> tup = (1, 2, 3)
>>> tup.__sizeof__()
48

可以看到，对列表和元组，我们放置了相同的元素，但是元组的存储空间，却比列表要少 16 字节。这是为什么呢？

事实上，由于列表是动态的，所以它需要存储指针，来指向对应的元素（上述例子中，对于 int 型，8 字节）。另外，由于列表可变，所以需要额外存储已经分配的长度大小（8 字节），这样才可以实时追踪列表空间的使用情况，当空间不足时，及时分配额外空间。整个可能听起来不是很好理解，可以结合下面的示例看看：

>>> l = []
// 空列表的存储空间为40字节
>>> l.__sizeof__()
40
>>>
>>> l.append(1)
// 加入了元素1之后，列表为其分配了可以存储4个元素的空间 (72 - 40)/8 = 4
>>> l.__sizeof__()
72
>>> l.append(2)
// 由于之前分配了空间，所以加入元素2，列表空间不变
>>> l.__sizeof__()
72
>>> l.append(3)
# 同上
>>> l.__sizeof__()
72
>>> l.append(4)
# 同上
>>> l.__sizeof__()
72
>>> l.append(5)
// 加入元素5之后，列表的空间不足，所以又额外分配了可以存储4个元素的空间
>>> l.__sizeof__()
104

可以看到列表空间分配的大概过程，为了减小每次增加 / 删减操作时空间分配的开销，Python 每次分配空间时都会额外多分配一些，这样的机制（over-allocating）保证了其操作的高效性：增加 / 删除的时间复杂度均为 O(1)。

但是对于元组，情况就不同了。元组长度大小固定，元素不可变，所以存储空间固定。

你也许会觉得，这样的差异可以忽略不计。但是想象一下，如果列表和元组存储元素的个数是一亿，十亿甚至更大数量级时，你还能忽略这样的差异吗？

1.3 列表和元组的性能

通过学习列表和元组存储方式的差异，我们可以得出结论：元组要比列表更加轻量级一些，所以总体上来说，元组的性能速度要略优于列表。

另外，Python 会在后台，对静态数据做一些资源缓存（resource caching）。通常来说，因为垃圾回收机制的存在，如果一些变量不被使用了，Python 就会回收它们所占用的内存，返还给操作系统，以便其他变量或其他应用使用。

但是对于一些静态变量，比如元组，如果它不被使用并且占用空间不大时，Python 会暂时缓存这部分内存。这样，下次我们再创建同样大小的元组时，Python 就可以不用再向操作系统发出请求，去寻找内存，而是可以直接分配之前缓存的内存空间，这样就能大大加快程序的运行速度。

下面的例子，是计算初始化一个相同元素的列表和元组分别所需的时间。我们可以看到，元组的初始化速度，要比列表快接近 5 倍。

Ps：对于简单并且运行速度很快的代码块，建议用timeit。因为程序中还有很多因素会影响计算的时间，比如垃圾回收机制。使用timeit会自动关掉垃圾回收机制，让程序的运行更加独立，时间计算更加准确。

$ python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 12 nsec per loop

$ python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 51.5 nsec per loop

但如果是索引操作的话，两者的速度差别非常小，几乎可以忽略不计。

$ python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'
10000000 loops, best of 5: 28 nsec per loop

$ python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'
10000000 loops, best of 5: 28.2 nsec per loop

当然，如果你想要增加、删减或者改变元素，那么列表显然更优。原因你现在肯定知道了，那就是对于元组，你必须得通过新建一个元组来完成。

1.4 列表和元组的使用场景

列表和元组到底用哪一个需要具体情况具体分析。

1. 如果存储的数据和数量不变，比如你有一个函数，需要返回的是一个地点的经纬度，然后直接传给前端渲染，那么肯定选用元组更合适。

2. 如果存储的数据或数量是可变的，比如社交平台上的一个日志功能，是统计一个用户在一周之内看了哪些用户的帖子，那么则用列表更合适。

1.5 小结

总的来说，列表和元组都是有序的，可以存储任意数据类型的集合，区别主要在于下面这两点。

列表是动态的，长度可变，可以随意的增加、删减或改变元素。列表的存储空间略大于元组，性能略逊于元组。
元组是静态的，长度大小固定，不可以对元素进行增加、删减或者改变操作。元组相对于列表更加轻量级，性能稍优。