Python内置数据结构——集合set

集合set

去重的,可变的,可迭代的,无序的 元素集合

set的元素必须是可hash的

约定

  • set翻译为集合

  • collection 翻译为集合类型,是一个大概念

set定义 初始化

  • set() -> new empty set object

  • set(iterable) -> new set object

s1 = set()  #空set
s2 = set(range(5))
s3 = set(list(range(10)))
s4 = {} # 空{}是空字典(dict)不是空set
s5 = {9 ,10, 11} # set
s6 = {(1,2) , 3, 'a'}
s7 = {[1],(1,),1}  # 报错:[1] 是unhashable type: 'list'

set的元素

  • set 的元素要求必须是可hash

  • 目前学过的不可hash的类型有list,set,bytearray

  • 元素不可以索引

  • set 可以迭代

set增加

  • add(elem) -> None

  •     增加一个元素到set中

  •     如果元素存在,什么都不做(set的去重性质)

  • update( * others)   -> None

  •     合并其他元素到set集合中来

  •     参数others必须是可迭代对象,可以是多个用逗号隔开

  •     就地修改

set删除

  • remove(elem) -> None

  •     从set中移除一个元素

  •     元素不存在,抛出keyError异常

  • discard(elem) -> None

  •     从set中移除一个元素

  •     元素不存在什么都不做

  • pop() -> item

  •     移除并返回任意的元素.(类似随机的)

  •     空集合返回keyError异常

  • clear()

  •     移除所有元素

set 修改,查询

修改:

  • 要么删除,要么加入新的元素

查询:

  • 非线性结构,无法索引

遍历:

  • 可以迭代所有元素

成员运算符

  •     in 和 not in 判断元素是否在set中

  •     效率为 O(1)  ### list,tuple等用成员运算符时,效率为O(n)

set 和线性结构

  • 线性结构的查询时间复杂度是O(n),随着数据规模的增大而增加耗时

  • set,dict等结构,内部使用hash值作为Key,时间复杂度可以做到O(1),查询时间和数据规模无关

可hash

  •     数值型int,float,complex

  •     布尔型 True,False

  •     字符串 string,bytes

  •     tuple

  •     None

  •     以上都是不可变类型,称为可哈希类型,hashable


集合

基本概念

  • 全集: 所有元素的集合.例如实数集,所有实数组成的集合就是全集

  • 子集subset和超集superset: 一个集合A所有的元素都在另一个集合B内,A是B的子集,B是A的超集

  • 真子集和真超集: A是B的子集,且A不等于B,A就是B的真子集,B是A的真超集

  • 并集: 多个集合合并的解构

  • 交集: 多个集合的公共部分

  • 差集: 集合中除去和其他集合公共部分


集合运算

并集

将两个集合A和B的所有的元素合并到一起,组成的集合称作集合A与集合B的并集

  • set.union(*others)

        返回和多个集合合并后的新的集合

  • | 运算符重载

        等同union

  • set.update(*others) -> None

        和多个集合合并,就地修改

  • |= ->  None

        等同update

交集

集合A和B,由所有属于A且属于B的元素组成的集合

  • set.intersection(* others)

        返回和多个集合的交集

  • &

        等同intersection

  • set.intersection_update(*others) -> None

        获取和多个集合的交集,并就地修改

  • &= -> None

        等同intersection_update

差集

集合A和B,由所有属于A且不属于B的元素组成的集合

  • set.differentce(*others)

        返回和多个集合的差集

  • -

        等同difference

  • set.difference_update(*others)

        获取和多个合集的差集并就地修改

  • -=

        等同difference_update(*others)

对称差集

集合A和B,由所有不属于A和B的交集元素组成的集合,基座(A-B)U(B-A)

  • symmetric_difference(other)

        返回和另一个集合的差集

  • ^

        等同symmetric_difference(other)

  • symmetric_difference_update(other)

        获取和另一个集合的差集并就地修改

  • ^=

        等同symmetric_difference_update

集合判断

  • set.issubset(other), <=

        判断当前集合是否是other的子集

  • set1 < set2

        判断set1 是否是set2 的真子集

  • set.issuperset(other) >=

        判断当前集合是否是other的超集

  • set1 > set2

        判断set1 是否是 set2 的真超集

  • set.isdisjoint(other)

        当前集合和另一个集合没有交集

        没有交集,返回True


猜你喜欢

转载自blog.51cto.com/13886191/2161415