Python自动化开发-Day3

1、字符编码和转码

  1.1.在python2默认编码是ASCII, python3里默认是unicode

  1.2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), so utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf8省空间

  1.3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string

import sys
print(sys.getdefaultencoding())#打印编码格式

msg = '我是一个BOY'
msg_gb2312 = msg.encode("gb2312")
print(msg_gb2312)
gb2312_to_unicode = msg_gb2312.decode('gb2312')
print(gb2312_to_unicode)
gb2312_to_utf8 = msg_gb2312.decode('gb2312').encode('utf-8')
print(gb2312_to_utf8)
View Code

2、文件操作流程

  1. 打开文件,得到文件句柄并赋值给一个变量
  2. 通过句柄对文件进行操作
  3. 关闭文件 

#打开文件
file object = open(file_name [, access_mode][, encoding='utf-8'])

#关闭文件
file.close()

#为了避免打开文件后忘记关闭,可以通过管理上下文,即:
with open('file','access_mode') as f:

#
file.read([size])    #从文件读取指定的字节数,如果未给定或为负则读取所有。
file.readline([size])#读取整行,包括 "\n" 字符。    
file.readlines([sizehint])#读取所有行并返回列表,若给定sizeint>0,则是设置一次读多少字节,这是为了减轻读取压力。

#
file.write(str)#将字符串写入文件,返回的是写入的字符长度。
file.writelines(sequence)#向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

#设置文件当前位置
file.seek(offset[, whence])

#返回文件当前位置。
file.tell()

#截取文件,截取的字节通过size指定,默认为当前文件位置。
file.truncate([size])
View Code

3、函数

    3.1定义:函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可

      特性:

      1. 减少重复代码
      2. 使程序变的可扩展
      3. 使程序变得易维护

    3.2参数:

      普通参数,默认参数,可变参数*args(返回元组 可变位置参数,可变关键字参数),**kwargs(返回字典keyword-only) 参数

    调用函数(传参):

      位置参数,关键字参数,参数结构(位置参数解构,关键字参数解构)   关键参数必须放在位置参数之后

    3.3局部变量和全局变量:

      在子程序中定义的变量称为局部变量,在程序的一开始定义的变量称为全局变量。

      全局变量作用域是整个程序,局部变量作用域是定义该变量的子程序。

      当全局变量与局部变量同名时:在定义局部变量的子程序内,局部变量起作用;在其它地方全局变量起作用。

   3.4 返回值

    要想获取函数的执行结果,就可以用return语句把结果返回

    注意:

    1.  函数在执行过程中只要遇到return语句,就会停止执行并返回结果,so 也可以理解为 return 语句代表着函数的结束
    2.  如果未在函数中指定return,那这个函数的返回值为None 

    3.5递归特性:

          必须有一个明确的结束条件

          每次进入更深一层递归时,问题规模相比上次递归都应有所减少

          递归效率不高,递归层次过多会导致栈溢出(在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出)

 

猜你喜欢

转载自www.cnblogs.com/Dashuang/p/9452459.html