Python基础必掌握的集合Set使用

学Python数据科学,玩游戏、学日语、搞编程一条龙。

整套学习自学教程中应用的数据都是《三國志》、《真·三國無雙》系列游戏中的内容。

数学中对集合的严格定义可能是抽象的且难以掌握。但实际上可以将集合简单地认为是定义明确的不同对象的集合,通常称为元素或成员。

Python 提供了一个内置的集合类型来将对象分组到一个集合中。集合类型(set type)是处理集合的数据类型。

集合类型的特点是它是一种与列表类型非常相似的数据类型,但它不能存储重复值,它没有下标和键等概念,并且是唯一元素,并且元素是可维护的。

利用这个特性,集合类型可以进行集合、交集、差等集合操作,适合管理类型。
在这里插入图片描述

定义一个集合

集合是无序的,并且元素是唯一的,集合本身可以修改,但集合中包含的元素必须是不可变类型。
在这里插入图片描述

构建集合的方式

# 构建的set数据会自动进行去重
x = set(<iter>)

list方式

x = set(['曹操', '孫権', '劉備', '曹操', '司馬懿'])
x
{
    
    '司馬懿', '曹操', '孫権', '劉備'}

tuple方式

x = set(('曹操', '孫権', '劉備', '曹操', '司馬懿'))
x
{
    
    '司馬懿', '曹操', '孫権', '劉備'}

字符串方式

s = '董卓'
list(s)
['q', 'u', 'u', 'x']
set(s)
{
    
    'x', 'u', 'q'}

集合set自动排序且元素不可变

x = {
    
    42, '曹操', (1, 2, 3), 3.14159}
x
{
    
    42, '曹操', 3.14159, (1, 2, 3)}

list和dict不能被set

a = [1, 2, 3]
{
    
    a}
Traceback (most recent call last):
  File "F:/PythonWorkProject/test.py", line 197, in <module>
    {
    
    a}
TypeError: unhashable type: 'list'

d = {
    
    'a': 1, 'b': 2}
{
    
    d}
Traceback (most recent call last):
  File "F:/PythonWorkProject/test.py", line 197, in <module>
    {
    
    d}
TypeError: unhashable type: 'dict'

集合的大小和成员资格

方法 len() 、in 、 not in 的应用。

x = {
    
    '曹操', '孫権', '劉備'}

len(x)
3

'孫権' in x
True

'司馬懿' in x
False

集合的9种操作

在这里插入图片描述

计算集合并集

在这里插入图片描述

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '劉備', '司馬懿', '董卓'}

x1.union(x2[, x3 …])

x1.union(x2)
{
    
    '劉備', '董卓', '司馬懿', '孫権', '曹操'}

x1 | x2 [| x3 …]

x1 | x2
{
    
    '劉備', '董卓', '司馬懿', '孫権', '曹操'}

多集合合并操作

a = {
    
    1, 2, 3, 4}
b = {
    
    2, 3, 4, 5}
c = {
    
    3, 4, 5, 6}
d = {
    
    4, 5, 6, 7}

a.union(b, c, d)
{
    
    1, 2, 3, 4, 5, 6, 7}

a | b | c | d
{
    
    1, 2, 3, 4, 5, 6, 7}

计算集合交集

在这里插入图片描述

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '劉備', '司馬懿', '董卓'}

x1.intersection(x2[, x3 …])

x1.intersection(x2)
{
    
    '劉備'}

x1 & x2 [& x3 …]

x1 & x2
{
    
    '劉備'}

多集合交集操作

a = {
    
    1, 2, 3, 4}
b = {
    
    2, 3, 4, 5}
c = {
    
    3, 4, 5, 6}
d = {
    
    4, 5, 6, 7}
a.intersection(b, c, d)
{
    
    4}
a & b & c & d
{
    
    4}

计算集合之间差异

在这里插入图片描述

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '劉備', '司馬懿', '董卓'}

x1.difference(x2[, x3 …])

x1.difference(x2)
{
    
    '曹操', '孫権'}

x2.difference(x1)
{
    
    '董卓', '司馬懿'}

x1 - x2 [- x3 …]

x1 - x2
{
    
    '曹操', '孫権'}

x2 - x1
{
    
    '董卓', '司馬懿'}

更多的集合差异操作

a = {
    
    1, 2, 3, 30, 300}
b = {
    
    10, 20, 30, 40}
c = {
    
    100, 200, 300, 400}
a.difference(b, c)
{
    
    1, 2, 3}
a - b - c
{
    
    1, 2, 3}

计算集合间对称差

在这里插入图片描述

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '劉備', '司馬懿', '董卓'}

x1.symmetric_difference(x2)

x1.symmetric_difference(x2)
{
    
    '曹操', '司馬懿', '董卓', '孫権'}

x1 ^ x2 [^ x3 …]

x1 ^ x2
{
    
    '曹操', '司馬懿', '董卓', '孫権'}

更多的集合对称差操作

a = {
    
    1, 2, 3, 4, 5}
b = {
    
    10, 2, 3, 4, 50}
c = {
    
    1, 50, 100}
a ^ b ^ c
{
    
    100, 5, 10}

判断两个集合是否包含相同的元素

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '劉備', '司馬懿', '董卓'}

x1.isdisjoint(x2),包含返回 False,不包含返回 True(x1 & x2是空集)。

x1.isdisjoint(x2)
False

x2 - {
    
    '劉備'}
{
    
    '董卓', '司馬懿'}

x1.isdisjoint(x2 - {
    
    '劉備'})
True

x1 = {
    
    1, 3, 5}
x2 = {
    
    2, 4, 6}
x1.isdisjoint(x2)
True
x1 & x2
set()

判断一个集合是否是另一个集合的子集

x1.issubset(x2),是则返回 True,否则返回 False,即x1 <= x2。一个集合被认为是它自身的一个子集。

x1 = {
    
    '曹操', '孫権', '劉備'}

x1.issubset({
    
    '曹操', '孫権', '劉備', '司馬懿', '董卓'})
True

x2 = {
    
    '劉備', '司馬懿', '董卓'}
x1 <= x2
False

x = {
    
    1, 2, 3, 4, 5}
x.issubset(x)
True
x <= x
True

判断一个集合是否是另一个集合的真子集

# x1 < x2
x1 = {
    
    '曹操', '孫権'}
x2 = {
    
    '曹操', '孫権', '劉備'}
x1 < x2
True
x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '孫権', '劉備'}
x1 < x2
False

# 子集与真子集的判断
x = {
    
    1, 2, 3, 4, 5}
x <= x
True
x < x
False

判断一个集合是否是另一个集合的超集

x1.issuperset(x2),是返回 True,否则返回 False。集合被认为是本身的一个子集,默认为自身超集。

# x1 >= x2
x1 = {
    
    '曹操', '孫権', '劉備'}
x1.issuperset({
    
    '曹操', '孫権'})
True
x2 = {
    
    '劉備', '司馬懿', '董卓'}
x1 >= x2
False

x = {
    
    1, 2, 3, 4, 5}
x.issuperset(x)
True
x >= x
True

判断一个集合是否是另一个集合的正确超集

# x1 > x2
x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '孫権'}
x1 > x2
True
x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '孫権', '劉備'}
x1 > x2
False
# 集合不是其自身的正确超集
x = {
    
    1, 2, 3, 4, 5}
x > x
False

集合的9种修改

集合本身可以修改,不会收到集合中包含元素的限制。

update计算并集

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '劉備', '司馬懿'}

x1.update(x2[, x3 …])

x1.update(['司馬懿', '董卓'])
x1
{
    
    '劉備', '孫権', '司馬懿', '曹操', '董卓'}

x1 |= x2 [| x3 …]

x1 |= x2
x1
{
    
    '孫権', '曹操', '司馬懿', '劉備'}

intersection_update 计算交集

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '劉備', '司馬懿'}

x1.intersection_update(x2[, x3 …])

x1.intersection_update(['劉備', '司馬懿'])
x1
{
    
    '劉備'}

x1 &= x2 [& x3 …]

x1 &= x2
x1
{
    
    '曹操', '劉備'}

difference_update 按差异修改集合

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '劉備', '司馬懿'}

x1 -= x2
x1
{
    
    '孫権'}

x1.difference_update(['曹操', '孫権', '司馬懿'])
x1
set()

symmetric_difference_update 按对称差修改集合

x1 = {
    
    '曹操', '孫権', '劉備'}
x2 = {
    
    '曹操', '劉備', '司馬懿'}

x1.symmetric_difference_update(x2)

x1.symmetric_difference_update(['司馬懿', '董卓'])
x1
{
    
    '孫権', '董卓'}

x1 ^= x2

x1 ^= x2
x1
{
    
    '孫権', '司馬懿'}

add 元素添加到集合

x = {
    
    '曹操', '孫権', '劉備'}

x.add('司馬懿')
x
{
    
    '孫権', '劉備', '曹操', '司馬懿'}

remove 集合中移除一个元素

x = {
    
    '曹操', '孫権', '劉備'}

x.remove('劉備')
x
{
    
    '孫権', '曹操'}

# 如果元素步存在则引发异常
x.remove('司馬懿')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: '司馬懿'

discard 集合中移除一个元素

x = {
    
    '曹操', '孫権', '劉備'}

x.discard('劉備')
x
{
    
    '孫権', '曹操'}

x.discard('司馬懿')
x
{
    
    '孫権', '曹操'}

pop 集合中随机移除一个元素

x = {
    
    '曹操', '孫権', '劉備'}

x.pop()
'孫権'

x
{
    
    '劉備', '曹操'}

x.pop()
'劉備'

x
{
    
    '曹操'}

x.pop()
'曹操'

x
set()

x.pop()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'pop from an empty set'

clear 清空集合

x = {
    
    '曹操', '孫権', '劉備'}
x
{
    
    '曹操', '孫権', '劉備'}

x.clear()
x
set()

被冻结集合

freezeset 为 Python的内置类型,不可变、不可操作。

x = frozenset(['曹操', '孫権', '劉備'])

x
frozenset({
    
    '曹操', '劉備', '孫権'})

len(x)
3

x & {
    
    '劉備', '司馬懿', '董卓'}
frozenset({
    
    '劉備'})

尝试修改 freezeset 的方法会失败

x = frozenset(['曹操', '孫権', '劉備'])

x.add('司馬懿')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'add'

x.pop()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'pop'

x.clear()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'clear'

猜你喜欢

转载自blog.csdn.net/qq_20288327/article/details/124452089