Python中对Excel表格的存取应用

在做项目中需要对项目数据做一个统计及记录,python在自动化方面是再好不过了。下面介绍两种对Excel表格存取的方法。
一、openpyxl 库

from openpyxl import load_workbook
from openpyxl.styles import colors, Font, Fill, NamedStyle
from openpyxl.styles import PatternFill, Border, Side, Alignment

# 加载文件
wb = load_workbook('./5a.xlsx')

workbook: 工作簿,一个excel文件包含多个sheet。
worksheet:工作表,一个workbook有多个,表名识别,如“sheet1”,“sheet2”等。
cell: 单元格,存储数据对象

文章所用表格:
在这里插入图片描述

操作sheet

# 读取sheetname
print('输出文件所有工作表名:\n', wb.sheetnames)
ws = wb['5a']

# 或者不知道名字时
sheet_names = wb.sheetnames
ws2 = wb[sheet_names[0]]    # index为0为第一张表
print(ws is ws2)

输出文件所有工作表名:
[‘5a’]
True

# 修改sheetname

ws.title = '5a_'
print('修改sheetname:\n', wb.sheetnames)

修改sheetname:
[‘5a_’]

# 创建新的sheet
# 创建的新表必须要赋值给一个对象,不然只有名字但是没有实际的新表

ws4 = wb.create_sheet(index=0, title='newsheet')
# 什么参数都不写的话,默认插入到最后一个位置且名字为sheet,sheet1...按照顺序排列

ws5 = wb.create_sheet()
print('创建新的sheet:\n', wb.sheetnames)

创建新的sheet:
[‘newsheet’, ‘5a_’, ‘Sheet’]

# 删除sheet
wb.remove(ws4)  # 这里只能写worksheet对象,不能写sheetname
print('删除sheet:\n', wb.sheetnames)

删除sheet:
[‘5a_’, ‘Sheet’]

# 修改sheet选项卡背景色,默认为白色,设置为RRGGBB模式
ws.sheet_properties.tabColor = "FFA500"

# 读取有效区域

print('最大列数为:', ws.max_column)
print('最大行数为:', ws.max_row)

最大列数为: 5
最大行数为: 17

# 插入行和列
ws.insert_rows(1)  # 在第一行插入一行
ws.insert_cols(2, 4)  # 从第二列开始插入四列

# 删除行和列
ws.delete_cols(6, 3)  # 从第六列(F列)开始,删除3列即(F:H)
ws.delete_rows(3)   # 删除第三行

单元格操作

# 读取
c = ws['A1']
c1 = ws.cell(row=1, column=2)
print(c, c1)
print(c.value, c1.value)

<Cell ‘5a_’.A1> <Cell ‘5a_’.B1>
dth_title Province

扫描二维码关注公众号,回复: 4922354 查看本文章
# 修改
2ws['A1'] = '景区名称'
3ws.cell(1, 2).value = '省份'
4print(c.value, c1.value)

景区名称 省份

# 读取多个单元格
 
 cell_range = ws['A1:B2']
 colC = ws['C']
 col_range = ws['C:D']
 row10 = ws[10]
 row_range = ws[5:10]
 # 其返回的结果都是一个包含单元格的元组
 cell_range
# 注意!! 这里是两层元组嵌套,每一行的单元格位于同一个元组里。

((<Cell ‘5a_’.A1>, <Cell ‘5a_’.B1>), (<Cell ‘5a_’.A2>, <Cell ‘5a_’.B2>))

# 按照行列操作
for row in ws.iter_rows(min_row=1, max_row=3,
                        min_col=1, max_col=2):
    for cell in row:
        print(cell)
# 也可以用worksheet.iter_col(),用法都一样

<Cell ‘5a_’.A1>
<Cell ‘5a_’.B1>
<Cell ‘5a_’.A2>
<Cell ‘5a_’.B2>
<Cell ‘5a_’.A3>
<Cell ‘5a_’.B3>

# 合并单元格
ws.merge_cells('F1:G1')
ws['F1'] = '合并两个单元格'
# 或者
ws.merge_cells(start_row=2, start_column=6, end_row=3, end_column=8)
ws.cell(2, 6).value = '合并三个单元格'

# 取消合并单元格
ws.unmerge_cells('F1:G1')
# 或者
ws.unmerge_cells(start_row=2, start_column=6, end_row=3, end_column=8)

wb.save('./5a.xlsx')
# 保存之前的操作,保存文件时,文件必须是关闭的!!

注意!!!,openpyxl对Excel的修改并不像是xlwings一样是实时的,他的修改是暂时保存在内存中的,所以当后面的修改例如我接下来要在第一行插入新的一行做标题,那么当我对新的A1单元格操作的时候,还在内存中的原A1(现在是A2)的单元格,原有的修改就会被覆盖。所以要先保存,或者从一开始就计划好更改操作避免这样的事情发生。

样式修改
单个单元格样式

wb = load_workbook('./5a.xlsx')    # 读取修改后的文件
ws = wb['5a_']
# 我们来设置一个表头
ws.insert_rows(1)    # 在第一行插入新的一行
ws.merge_cells('A1:E1')  # 合并单元格
a1 = ws['A1']
ws['A1'] = '5A级风景区名单'

# 设置字体
ft = Font(name='微软雅黑', color='000000', size=15, b=True)
"""
name:字体名称
color:颜色通常是RGB或aRGB十六进制值
b(bold):加粗(bool)
i(italic):倾斜(bool)
shadow:阴影(bool)
underline:下划线(‘doubleAccounting’, ‘single’, ‘double’, ‘singleAccounting’)
charset:字符集(int)
strike:删除线(bool)
"""
a1.font = ft

# 设置文本对齐

ali = Alignment(horizontal='center', vertical='center')
"""
horizontal:水平对齐('centerContinuous', 'general', 'distributed',
                    'left', 'fill', 'center', 'justify', 'right')
vertical:垂直对齐('distributed', 'top', 'center', 'justify', 'bottom')

"""
a1.alignment = ali

# 设置图案填充

fill = PatternFill('solid', fgColor='FFA500')
# 颜色一般使用十六进制RGB
# 'solid'是图案填充类型,详细可查阅文档

a1.fill = fill

openpyxl.styles.fills模块参数文档

# 设置边框
bian = Side(style='medium', color='000000')    # 设置边框样式
"""
style:边框线的风格{'dotted','slantDashDot','dashDot','hair','mediumDashDot',
        'dashed','mediumDashed','thick','dashDotDot','medium',
        'double','thin','mediumDashDotDot'}
"""

border = Border(top=bian, bottom=bian, left=bian, right=bian)
"""
top(上),bottom(下),left(左),right(右):必须是 Side类型
diagonal: 斜线 side类型 
diagonalDownd: 右斜线 bool
diagonalDown: 左斜线 bool
"""

# a1.border = border
for item in ws['A1:E1'][0]:   # 去元组中的每一个cell更改样式
    item.border = border

wb.save('./5a.xlsx')  # 保存更改

再次注意!!!:
不能使用 a1.border = border,否则只会如下图情况,B1:E1单元格没有线。我个人认为是因为线框涉及到相邻单元格边框的改动所以需要单独对每个单元格修改才行。
不能使用ws[‘A1:E1’].border = border,由前面的内容可知,openpyxl的多个单元格其实是一个元组,而元组是没有style的方法的,所以必须一个一个改!!其实官方有其他办法,后面讲。
在这里插入图片描述

按列或行设置样式

# 现在我们对整个表进行设置

# 读取
wb = load_workbook('./5a.xlsx')
ws = wb['5a_']

# 读取数据表格范围
rows = ws.max_row
cols = ws.max_column

# 字体
font1 = Font(name='微软雅黑', size=11, b=True)
font2 = Font(name='微软雅黑', size=11)

# 边框
line_t = Side(style='thin', color='000000')  # 细边框
line_m = Side(style='medium', color='000000')  # 粗边框
border1 = Border(top=line_m, bottom=line_t, left=line_t, right=line_t)
# 与标题相邻的边设置与标题一样
border2 = Border(top=line_t, bottom=line_t, left=line_t, right=line_t)

# 填充
fill = PatternFill('solid', fgColor='CFCFCF')

# 对齐
alignment = Alignment(horizontal='center', vertical='center')

# 将样式打包命名
sty1 = NamedStyle(name='sty1', font=font1, fill=fill,
                  border=border1, alignment=alignment)
sty2 = NamedStyle(name='sty2', font=font2, border=border2, alignment=alignment)

for r in range(2, rows+1):
    for c in range(1, cols):
        if r == 2:
            ws.cell(r, c).style = sty1
        else:
            ws.cell(r, c).style = sty2

wb.save('./5a.xlsx')

在这里插入图片描述
对于,设置标题样式,其实官方也给出了一个自定义函数(链接阅读原文),设定范围后,范围内的单元格都会合并,并且应用样式,就像是单个cell一样。在这里就不多赘述了,有兴趣的可以看看。很实用。

二、xlwt/xlrd库
①存Excel文件:(如果存储数据中有字符,那么写法还有点小小的变化)

import xlwt
 
workbook = xlwt.Workbook(encoding='utf-8')
booksheet = workbook.add_sheet('Sheet 1', cell_overwrite_ok=True)
#存第一行cell(1,1)和cell(1,2)
booksheet.write(0,0,34)
booksheet.write(0,1,38)
#存第二行cell(2,1)和cell(2,2)
booksheet.write(1,0,36)
booksheet.write(1,1,39)
#存一行数据
rowdata = [43,56]
for i in range(len(rowdata)):
    booksheet.write(2,i,rowdata[i])
workbook.save('test_xlwt.xls')

在这里插入图片描述
②读Excel文件:(同样是对于数值类型数据)

import xlrd
 
workbook = xlrd.open_workbook('D:\\Py_exercise\\test_xlwt.xls')
print(workbook.sheet_names())                  #查看所有sheet
booksheet = workbook.sheet_by_index(0)         #用索引取第一个sheet
booksheet = workbook.sheet_by_name('Sheet 1')  #或用名称取sheet
#读单元格数据
cell_11 = booksheet.cell_value(0,0)
cell_21 = booksheet.cell_value(1,0)
#读一行数据
row_3 = booksheet.row_values(2)
print(cell_11, cell_21, row_3)

>>>34.0 36.0 [43.0, 56.0]

以上是关于Python中Excel表格的应用方法总结,如有不足,请联系博主改正。该博文中转载了他人的文章,在此表示衷心的感谢,并附上原文链接以供参考。
https://mp.weixin.qq.com/s/FGbxo8-7W6IsqSmMygadKA
https://blog.csdn.net/index20001/article/details/73844576

猜你喜欢

转载自blog.csdn.net/zbb297918657/article/details/86488173