一.集合

集合（set）是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4

# 1. 集合的创建
s = {
    
    1, 2, 3, 1, 2, 3} # {1, 2, 3}
print(s, type(s))
# 注意点1: 集合的元素必须时不可变数据类型。
# s = {1, 2, 3, [1, 2, 3]}
# print(s, type(s))
# 注意点2:空集合不能使用{}, 而要使用set()
# s = {}   # {} 是用来创建一个空字典
# print(s, type(s))
s  = set()
print(s, type(s))

# 2. 集合的特性:
# 不支持+,*, index(索引), slice(切片)(因为集合无序不重复的)
# 支持in和not in
print(1 in {
    
    1, 2, 3, 4})

在这里插入图片描述

# 3. 集合的常用操作
# 3-1). 增加
#       add: 添加单个元素
#       update: 添加多个元素
s = {
    
    1, 2, 3}
s.add(100)
print(s)
s = {
    
    1, 2, 3}
s.update({
    
    4, 5, 6})
print(s)

# 3-2). 删除
#       remove: 如果元素存在，删除，否则报错
#       discard: 如果元素存在，删除，否则do nothing
#       pop: 随机
#       删除元素，集合为空则报错
s = {
    
    1, 2, 3}
s.remove(3)
print(s)
s = {
    
    1, 2, 3}
s.discard(100)
print(s)
s = {
    
    1, 66, 2,99, 78, 3}
s.pop()
print(s)

# 3-3). 查看
#           差集: s1 - s2
#           交集: s1 & s2
#           对称差分: s1 ^ s2
#           并集: s1 | s2
s1 = {
    
    1, 2, 3}
s2 = {
    
    1, 2}
print(s1 - s2)  # {3}
print(s1 & s2)  # {1, 2}
s1 = {
    
    1, 2, 3}
s2 = {
    
    1, 2, 4}
print(s1 ^ s2)  # {3, 4},  {1, 2, 3, 4} - {1, 2} = {3,4}  |-&=^
print(s1 | s2)  # {1, 2, 3, 4}
print(s1.issubset(s2))  # False  s2是s1的子集吗
print(s1.isdisjoint(s2)) # False, s1和s2没有交集吗?判断这句话是否正确

# 4. 拓展: frozenset不可变的集合
# set 集合中所有能改变集合本身的方法（如 add、remove、discard、xxx_update 等），frozenset 都不支持；set 集合中不改变集合本身的方法，fronzenset 都支持。
s = frozenset({
    
    1, 2, 3})
print(s, type(s))
"""
frozenset 的这些方法和 set 集合同名方法的功能完全相同。frozenset 的作用主要有两点： 
 当集合元素不需要改变时，使用 frozenset 代替 set 更安全。
 当某些 API 需要不可变对象时，必须用 frozenset 代替set。比如 dict 的 key 必须是不可变对象，因此只能用 frozenset；再比如 set 本身的集合元素必须是不可变的，因此 set 不能包含 set，set 只能包含 frozenset
"""

"""
练习:
明明想在学校中请一些同学一起做一项问卷调查，为了实验的客观性，他先用计算机生成了N个1到1000之间的随机整数（N≤1000），对于其中重复的数字，只保留一个，把其余相同的数去掉，不同的数对应着不同的学生的学号。然后再把这些数从大到小排序，按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据，希望大家能正确处理)。
"""
import random
n = int(input("输入n:"))
s=set()
for i in range(n):
  s.add(random.randint(1,1000))
print(sorted(s,reverse=True))

二.字典

字典是另一种可变容器模型，且可存储任意类型对象。
键一般是唯一的，如果重复最后的一个键值对会替换前面的，值不需要唯一

# 1. 字典的创建dict
# key-value对或者键值对
d = {
    
    "name":"westos", "age":18, "city":"西安"}
print(d, type(d))
d = {
    
    }
print(d, type(d))

# 2. 字典的特性
# 不支持+,*, index, slice(因为集合无序不重复的)
# 支持in和not in
d = {
    
    "name":"westos", "age":18, "city":"西安"}
print('name' in d)  # True， 判断是否为所有key值得成员
print("westos" in d) # False

在这里插入图片描述

# 3. 字典的常用方法
# 3-1). 查看
"""
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
"""
d = {
    
    "name":"westos", "age":18, "city":"西安"}
print(d.keys())  # 查看字典所有的key值
print(d.values())  # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d['name'])   # 查看key为name对应的value值
# print(d['province'])   # 查看key对应的vlaue值，如果不存在会报错。
print(d.get('province'))  # 查看key对应的vlaue值， 如果存在则返回，如果不在在则返回None.
print(d.get('province', "陕西"))  # 查看key对应的vlaue值， 如果存在则返回，如果不在在则返回默认值.

# 3-2). 增加和修改
d = {
    
    "name":"westos", "age":18}
d['city'] = "西安"   # key不存在就添加
print(d)
d['city'] = "北京"   # key存在则修改value值
print(d)

d = {
    
    "name":"westos", "age":18}
d.setdefault('city', "西安")  # key不存在就添加
print(d)
d.setdefault('city', "北京") # key存在，则do nothing
print(d)

# 3-3). 删除
d = {
    
    "name":"westos", "age":18}
d.pop('name')
print(d)
d = {
    
    "name":"westos", "age":18}
del d['name']
print(d)

# 4. 遍历字典(for)
d = {
    
    "name":"westos", "age":18, "city":"西安"}
# 默认情况下，字典只会遍历key值
for item in d:
    print(item)

# 如果遍历字典的key和value呢?(特别特别重要)
for key,value in d.items():  # [('name', 'westos'), ('age', 18), ('city', '西安')]
    print(f"key={key}, value={value}")

"""
练习:两数之和
给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出 和为目标值 的那 两个 整数，并返回它们的数组下标。
你可以假设每种输入只会对应一个答案。但是，数组中同一个元素不能使用两遍。
你可以按任意顺序返回答案。
"""

在这里插入图片描述

# 5. defaultdict
"""
collections.defaultdict类，本身提供了默认值的功能， 默认值可以是整形，列表，集合等.
defaultdict 是 dict 的子类。但它与 dict 最大的区别在于，如果程序试图根据不存在的 key 访问 value，会引发 KeyError 异常；而 defaultdict 提供default_factory 属性，该为不存在的 key 来自动生成生成默认的 value。

需求： 
 	我们想要一个能将键（key）映射到多个值的字（即所谓的一键多值字典）
解决方案：
	1). 字典是一种关联容器，每个键都映射到一个单独的值上。如果想让键映射到多个值，需要将这些多个值保存到容器（列表或者集合）中。
	2). 利用collections模块中的defaultdict类自动初始化第一个值，这样只需关注添加元素.
"""
from collections import  defaultdict

# 默认字典，设置默认value
d = defaultdict(int)
d['views'] += 1
d['transfer'] += 1
print(d)

d = defaultdict(list)
d['allow_users'].append('westos')
d['deny_users'].extend(['user1', 'user2'])
print(d)

d = defaultdict(set)
d['love_movies'].add("黑客帝国")
d['dislike_movies'].update({
    
    '前任3', '电影xxxx'})
print(d)

三.内置数据结构总结

(一)可变与不可变数据类型
1.可变数据类型:
如list, set, dict,可以增删改。可变数据类型，允许变量的值发生变化，即如果对变量进行append、+=等这种操作后，只是改变了变量的值，而不会新建一个对象，变量引用的对象的地址也不会变化，不过对于相同的值的不同对象，在内存中则会存在不同的对象，即每个对象都有自己的地址，相当于内存中对于同值的对象保存了多份，这里不存在引用计数，是实实在在的对象。
2.不可变数据类型:
如数值类型，tuple, str,不可以增删改。python中的不可变数据类型，不允许变量的值发生变化，如果改变了变量的值，相当于是新建了一个对象，而对于相同的值的对象，在内存中则只有一个对象，内部会有一个引用计数来记录有多少个变量引用这个对象。
(二)有序序列和无序序列
在这里插入图片描述
有序序列特性: 索引、切片、连接操作符、重复操作符以及成员操作符等特性

内置数据结构---集合与字典

一.集合

二.字典

三.内置数据结构总结

猜你喜欢