day9-python的字符串(内容较多)

python中的字符串

一、 什么是字符串(str)

字符串是容器型数据类型, 将单引号或者双引号作为容器的标志, 元素不需要用逗号隔开: ‘元素1元素2元素3…’
字符串是不可变的(不支持增删改);字符串是有序的(支持下标操作)

字符串中的元素: 只能是文本符号(所有计算机能表达出来的符号都可以作为字符串的元素),一个符号对应一个元素
‘湖北’, ‘abcn’,’!@#$%’, ‘↑♦’, ‘123456’

字符串中每一个独立的元素又叫:字符;python中只有字符的概念,但是没有字符对应的数据类型

1.空串

str1 = ''
str2 = ""
str3 = ''''''
str4 = """"""
print(type(str1), type(str2), type(str3), type(str4))

2.非空字符串

str11 = 'abc'
str22 = "你好"
str33 = '''你好,hello'''
str44 = """123,hai"""

二、 字符(字符串中的元素)

(一)、普通字符、转义字符

字符串中的字符分两种:普通字符、转义字符

1)普通字符 - 除了转义字符串以外的字符
2)转义字符 - 在指定符号前加\用来表示一些特殊功能和特殊意义的字符

\n - 换行
\t - 制表符(按tab键)
’ - 单引号
" - 双引号
\ - 反斜杠

(二)、编码字符:\u4位的十六进制

str1 = '\tabc\n123'
print(str1)

str2 = 'abc\'123'
str3 = "abc\"123"
str4 = 'abc\\n123'
print(str4)

# 这儿 \u4e00 和 \u7800 都是转义字符中的编码字符
str5 = '\u4e00你好!\u7800'
print(str5, len(str5))

# 注意: 计算字符串长度的时候,一个转义字符的长度是1
3) 阻止转义(r语法)

在字符串的最前面加 r/R , 那么这个字符串中的所有的转义字符都无效

str6 = r'\tabc\n123\u4e00'
print(str6)

三、什么是字符编码

计算机在存储数据的时候只能存数字,而且存的是数字的补码
为了能够让计算机存储文本数据,给每个字符关联了一个固定的数字,用来对这个字符进行存储。每个字符关联的那个数字就是这个字符的编码值。

编码表

1)ASCII码表:用1个字节来对字符进行编码(码值范围:0 ~ 127)

a.数字在字母的前面(字符0~字符9的编码值连续递增)
b.大写字母在小写字母的前面(字母之间是连续递增)
c.大写字母和小写字母之间有其他的符号(不连续)

2)Unicode编码表

Unicode编码表是对ASCII表的扩展(Unicode编码表中包含了ASCII表中所有的符号)
Unicode编码表中包含了世界上所有国家所有民族所有的语言的符号,总共65536个
中文范围:4e00 ~ 9fa5

1)chr函数

chr(编码值) - 获取指定编码值对应的字符

print(chr(0x0F00))
for x in range(0x0F00, 0x0FFF):
    print(chr(x), end=',')
print()

# 打印所有的中文
count = 0
for x in range(0x4e00, 0x9fa5):
    print(chr(x), end=' ')
    count += 1
    if count % 40 == 0:
        print()
print()

2) ord函数

ord(字符) - 获取指定字符对应的编码值

print(ord('余'), ord('婷'))

3) 编码字符

str1 = '\u4e00你好!'
print(str1)

四、字符串的相关操作

1. 获取字符串中的元素(获取字符)

字符串获取元素和列表获取元素的语法一样

str1 = 'how are you!'
1)获取单个元素
print(str1[2])
print(str1[-1])
2) 切片
print(str1[1:5])    # 'ow a'
print(str1[-3::-1])  # 'oy era woh'
3) 遍历
for x in str1:
    print(x)

for index in range(len(str1)):
    print(str1[index])

2. +, *

字符串1 + 字符串2 
字符串 * N / N * 字符串

str1 = 'abc'
str2 = '123'
print(str1 + str2)     # abc123
print(str1 * 2)        # abcabc

3. ==, !=

print(str1 == 'abc')     # True
print(str1 == 'bac')     # False

4. >, <, >=, <= (针对两个字符串)

两个字符串比较大小: 比较的是第一组不相等的字符的编码值的大小

str3 = 'zABC'
str4 = 'z1bcd'
print(str3 > str4)     # True

应用:
判断是否是数字字符: '0' <= char <= '9'
判断是否是小写字母:'a' <= char <= 'z'
判断是否是大写字母:'A' <= char <= 'Z'
判断是否是字母:'a' <= char <= 'z' or 'A' <= char <= 'Z'
判断是否是中文字符: '\u4e00' <= char <= '\u9fa5'

5. in 和 not in

字符串1 in 字符串2 - 判断字符串1是否是字符串2的子串

print('abc' in 'acbmn')   # False
print('abc' in 'abcmn')   # True
print('m' in 'abcmn')     # True

6.相关函数

max/min/sorted/reversed等,这些函数都适用于字符串

len(字符串) - 求字符串长度
str(数据) - 将自定数据转换成字符串

a.所有的数据都能转换成字符串
b.将数据的打印值作为字符串的内容
str1 = r'\tabc'
print(len(str1))    # 5

num = 100
str(num)        # '100'

str([1, 2, 3])   # '[1, 2, 3]'

五、字符串的相关方法

1. center/rjust/ljust/zfill

字符串.center(长度, 填充字符) - 产生一个新的字符串:长度是指定的长度,原字符串在新字符串的中间,左右用指定字符填充
字符串.rjust(长度, 填充字符) - 产生一个新的字符串:长度是指定的长度,原字符串在新字符串的最右边,左边用指定字符填充
字符串.zfill(长度) == 字符串.rjust(长度, ‘0’)
字符串.ljust(长度, 填充字符) - 产生一个新的字符串:长度是指定的长度,原字符串在新字符串的最左边,右边用指定字符填充

str1 = 'abc'
new_str1 = str1.center(7, 'x')
print(new_str1)     # xxabcxx

new_str2 = str1.rjust(7, '*')
print(new_str2)     # ****abc

new_str2 = str1.ljust(7, '*')
print(new_str2)     # abc****
# 练习1: 给任意一个商品的数字编号值,转换成固定格式的商品编码: GDXXXX  -> GD0001, GD0012,....

num = 2   # 0034
num_str = 'GD'+str(num).zfill(4)
print(num_str)

2. replace

字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2全部替换成字符3
字符串1.replace(字符串2, 字符串3, N) - 将字符串1中的前 N 个字符串2替换成字符串3

str1 = 'how are you? i am fine, Thank you!'
new_str = str1.replace('o', '*')
print(new_str)     # h*w are y*u? i am fine, Thank y*u!

new_str = str1.replace('o', '+', 2)
print(new_str)     # h+w are y+u? i am fine, Thank you!

new_str = str1.replace('you', 'me')
print(new_str)     # how are me? i am fine, Thank me!

字符串内建函数有四十来个,这里写不下,我会再附一篇专门写字符串的内建函数方法。今天就到这里,再见~

猜你喜欢

转载自blog.csdn.net/qq_48484950/article/details/106842049
今日推荐