기본 데이터 유형 및 문자 인코딩의 컬렉션

모음

1. 정의

  {} 복수의 요소는 콤마 소자 요건을 만족하는만큼 이격 :

    불변 타입들의 세트 내의 요소

      (집합 ([1,1,1,1,1,1 [11,222]) # 에러 인쇄

    소자 B의 순서화 컬렉션

    요소들의 세트가 반복 될 수 내에 C는 반복 요소 만 셀

2, 내장 방법

관계 연산자 ============== =============

friends1 = { "제로", "케빈", "제이슨", "에곤"}
friends2 = { "JY", "리키", "제이슨", "에곤"}

  A, 교차로에서 : 동일한 요소의 두 가지

    입술 = friends1 및 friends2

  b 및 설정 / 컬렉션을 두 집합의 모든 요소를

    고해상도 = friends1 | friends2

  C, 차분 세트 복용 : 추출에 공통 요소의 집합을, 나머지 차분 세트이며

    friends1 的 : 고해상도 = friends1 - friends2

    friends2 的 : 고해상도 = friends2 - friends1

  D, 대칭 차 두 요소들의 고유 집합, 즉 제거하기 위해 공통 요소

    입술 = friends1 ^ friends2

  전자, 부모의 부분 집합

    1, S1 : {1,2,3}

       S2 : {1,2,4} #의 포함 관계가 존재하지 않습니다

    인쇄 (S1> S2) #False

    2, S1 S2 종속, S1과 S2 세트의 세트는 아버지가되는 경우에만

      S1 = S2 때, 상호 상위 집합

================ 중복 제거 ===============

  오직 불변의 유형, 원래의 순서 보장 할 수 없습니다

패 =
    { '이름': '릴리', '나이'18 '섹스': '남성'}
    { '이름': '잭', '나이'73 '섹스': '남성'}
    { '이름': '톰', '나이'20 '섹스': '여성'}
    { '이름': '릴리', '나이'18 '섹스': '남성'}
    { '이름': '릴리', '나이'18 '섹스': '남성'}
]
new_l = []
리터에서 DIC를위한 :
    하지 new_l에서 DIC 경우 :
        new_l.append (DIC)

인쇄 (new_l)
 

다른 내장 방법 ####

S = {1,2,3}
당신은 내장되어하는 방법 필요
  1 : 폐기
    s.discard (4) # 삭제 요소는 아무것도하지 않는 존재하지 않습니다
    인쇄물)
    s.remove (4) # 오류가 존재하지 않는 요소를 제거
  2 : 갱신
    s.update ({1,3,5})
    인쇄물)
  3 : 팝
    입술 s.pop = ()
    인쇄 (고해상도)
  4 : 추가
    s.add (4)
      인쇄물)
 

두 문자 인코딩

HTTPS : //zhuanlan.zhihu.com/p/108805502 세부 사항을 참조

## 분석

  X = "上"
                    기억
번역 ----- ------- "0101010
에 "---- 번역"----- 0101010
 
문자 코드 표는 문자와 숫자 간의 일치의 테이블
 
 
A-00
B-01
C-10
D-11
 
ASCII 테이블 :
    1, 영어 문자열을 지원합니다
    영어 문자열에 해당하는 2, 8 비트 이진수
 
GBK 表 :
    1, 영어 문자, 중국어 문자를 지원합니다
    2,
    8 비트 (8 비트 = 1Bytes) 영어 문자열에 해당하는 이진수
    16 비트 (16 비트 = 2 바이트) 이진수 문자열을 중국어에 대응
 
 

unicode(内存中统一使用unicode):

    1、
        兼容万国字符
        与万国字符都有对应关系
    2、
    采用16位(16bit=2Bytes)二进制数对应一个中文字符串
    个别生僻会采用4Bytes、8Bytes
 
 
    unicode表:
                          内存
        人类的字符---------unicode格式的数字----------
                             |                     |
                             |                     |
                             |
                            硬盘                    |
                             |
                             |                     |
                             |                     |
                        GBK格式的二进制       Shift-JIS格式的二进制
 
        老的字符编码都可以转换成unicode,但是不能通过unicode互转
 
 
utf-8:
    英文->1Bytes
    汉字->3Bytes
 
 
 

结论:

    1、内存固定使用unicode,我们可以改变的是存入硬盘采用格式
        英文+汉字-》unicode-》gbk
        英文+日文-》unicode-》shift-jis
        万国字符》-unicode-》utf-8
 
    2、文本文件存取乱码问题
        存乱了:解决方法是,编码格式应该设置成支持文件内字符串的格式
        取乱了:解决方法是,文件是以什么编码格式存如硬盘的,就应该以什么编码格式读入内存
 
 
 

其他内置方法
s={1,2,3}
需要掌握的内置方法1discard
s.discard(4) # 删除元素不存在do nothing
print(s)
s.remove(4) # 删除元素不存在则报错


需要掌握的内置方法2update
s.update({1,3,5})
print(s)

需要掌握的内置方法3pop
res=s.pop()
print(res)

需要掌握的内置方法4add
s.add(4)
print(s)

추천

출처www.cnblogs.com/NevMore/p/12482319.html