20行代码搞定PDF表格转为Excel表

1.环境准备

  • 安装好python并且配置好环境
  • 安装pdfplumber、xlwt库
  • 使用Vscode或者PyCharm等编辑器

在pycharm中如果报红,可以鼠标点击报红的库,alt+enter进行安装

2.代码部分

import pdfplumber
import xlwt
# 读取源pdf文件
pdf = pdfplumber.open("./test.pdf")
# 创建excel
workboot = xlwt.Workbook()
# 创建sheet
sheet = workboot.add_sheet("Sheet1")
# 行计数
i = 0
# 循环读取pdf的每一页
for page in pdf.pages:
    # 读取表格
    for table in page.extract_tables():
        # 读取表格中的行
        for row in table:
            print(row)
            for j in range(len(row)):
                sheet.write(i, j, row[j])
            i += 1
pdf.close()
print(i)
workboot.save(".test.xlsx")

        最后把要转换的pdf文件名写到对应的地方,给xlsx文件命好名字,运行就可以得到对应的excel表了。

猜你喜欢

转载自blog.csdn.net/weixin_73609038/article/details/136588483