Python基础之collections模块

在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。

namedtuple

生成可以使用名字来访问元素内容的tuple。

from collections import namedtuple

Point = namedtuple('point', ['x', 'y'])
p = Point(1, 2)
print("横坐标为", p.x)
print("纵坐标为", p.y)

Circle = namedtuple('circle', ['x', 'y', 'r'])
c = Circle(1, 2, 3)
print("横坐标为", c.x)
print("纵坐标为", c.y)
print("半径为", c.r)

结果:

横坐标为 1
纵坐标为 2
横坐标为 1
纵坐标为 2
半径为 3

Process finished with exit code 0

deque

使用list存储数据时,按索引访问元素很快,但是插入和删除元素很慢,因为list是线性存储,数据量大的时候,插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈:

from collections import deque

q = deque(['a', 'b', 'c'])
q.append('x')  # 追加x
print('append:', q)
q.appendleft('y')  # 左边追加y
print('appendleft:', q)
q.pop()  # 删除x
print('pop:', q)
q.popleft()  # 左边删除y
print('popleft:', q)

结果:

append: deque(['a', 'b', 'c', 'x'])
appendleft: deque(['y', 'a', 'b', 'c', 'x'])
pop: deque(['y', 'a', 'b', 'c'])
popleft: deque(['a', 'b', 'c'])

Process finished with exit code 0

OrderedDict

有序字典,使用dict时,Key是无序的。在对dict做迭代时,我们无法确定Key的顺序。如果要保持Key的顺序,可以用OrderedDict:

from collections import OrderedDict

d = dict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])
print("key无序的字典")
print(d)
od = OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])
print("key有序的字典")
print(od)

结果:

key无序的字典
{'pear': 1, 'orange': 2, 'banana': 3, 'watermelon': 4}
key有序的字典
OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])

Process finished with exit code 0

注意,OrderedDict的Key会按照插入的顺序排列,不是Key本身排序:

defaultdict

带有默认值的字典

例题:有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。

即: {'k1': 大于66 , 'k2': 小于66}

from collections import defaultdict

values = [11, 22, 33, 44, 55, 66, 77, 88, 99]

my_dict = defaultdict(list)

for value in values:
    if value > 66:
        my_dict['k1'].append(value)
    else:
        my_dict['k2'].append(value)

print(my_dict)

结果:

defaultdict(<class 'list'>, {'k2': [11, 22, 33, 44, 55, 66], 'k1': [77, 88, 99]})

Process finished with exit code 0

Counter

Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。

from collections import Counter

c = Counter('sfsfdfdsferegfaahtjjfggfgfh')
print(c)

结果:

Counter({'f': 8, 'g': 4, 's': 3, 'd': 2, 'e': 2, 'a': 2, 'h': 2, 'j': 2, 'r': 1, 't': 1})

Process finished with exit code 0

猜你喜欢

转载自blog.csdn.net/qq_33567641/article/details/81474566