Python 자동화 오피스: Excel부터 PDF 생성까지 전체 프로세스

Python 프로그래밍의 무한한 가능성을 열어보세요. "Wonderful Python"을 통해 코드의 세계를 탐험할 수 있습니다.

현대 사무실 환경에서 데이터 처리 및 보고서 생성은 일상 업무에서 매우 중요한 부분입니다. 유연하고 강력한 프로그래밍 언어인 Python은 일련의 오픈 소스 라이브러리를 통해 사무 자동화를 실현할 수 있습니다. 이 기사에서는 Python을 사용하여 Excel 데이터 처리 부터 PDF 보고서 생성 openpyxl까지 자동화된 프로세스를 구현하는 방법을 자세히 설명합니다 .pandasreportlab

샘플 프로젝트를 사용하여 Excel에서 데이터를 읽고, 데이터를 처리하고, 데이터 보고서를 생성하고, 최종적으로 PDF 형식으로 출력하는 방법을 보여줍니다. 이러한 자동화된 사무 프로세스는 효율성을 크게 향상시키고 반복 작업을 줄일 수 있습니다.

1. 환경 준비

시작하기 전에 관련 Python 라이브러리가 설치되어 있는지 확인하세요. 우리는 다음 라이브러리를 사용할 것입니다:

openpyxl : 엑셀 파일을 처리하는데 사용됩니다.
pandas : 데이터 분석 및 처리에 사용됩니다.
Reportlab : PDF 파일을 생성하는 데 사용됩니다.

다음 명령을 사용하여 이러한 라이브러리를 설치할 수 있습니다.

pip install openpyxl pandas reportlab

`openpyxl`2. 엑셀 파일 사용 및 처리

openpyxlExcel 파일을 읽고 쓰기 위해 Python에서 일반적으로 사용되는 라이브러리입니다. 먼저 Excel 파일에서 데이터를 읽고 간단한 처리를 수행하는 방법을 보여 드리겠습니다.

2.1 엑셀 파일 읽기

직원 출석 데이터가 포함된 Excel 파일이 있다고 가정해 보겠습니다 data.xlsx. 테이블 구조는 다음과 같습니다.

이름	부서	출석일수	결근일수	총 일수
장산	인사부	20	2	22
존 도	재무부	18	4	22
왕우	기술부	22	0	22
자오리우	마케팅 부서	19	3	22

먼저 다음을 openpyxl사용하여 Excel에서 데이터를 읽습니다.

import openpyxl

# 打开Excel文件
workbook = openpyxl.load_workbook('data.xlsx')

# 选择工作表
sheet = workbook.active

# 读取表格数据
data = []
for row in sheet.iter_rows(min_row=2, values_only=True):
    data.append(row)

# 打印读取的数据
for row in data:
    print(row)

위 코드는 Excel에서 각 행의 데이터를 읽어서 data목록에 저장합니다. 이 메소드는 데이터를 한 줄씩 읽을 수 있습니다. 여기서는 헤더를 건너뛰도록 iter_rows설정했습니다 .min_row=2

2.2 엑셀 데이터 처리

부서별 총 출석 일수를 계산하는 등 읽은 데이터를 처리할 수 있습니다. 출석 일수를 기준으로 일부 통계를 생성한다고 가정해 보겠습니다.

from collections import defaultdict

# 统计每个部门的总出勤天数
attendance_summary = defaultdict(int)
for row in data:
    department = row[1]
    attendance_days = row[2]
    attendance_summary[department] += attendance_days

# 打印统计结果
for department, total_days in attendance_summary.items():
    print(f"{
     
      
      department}总出勤天数: {
     
      
      total_days}")

이 코드 조각은 각 부서의 총 출석 일수를 출력합니다.

`pandas`3. 데이터 처리를 위한 이용

openpyxlExcel 파일을 읽고 쓸 수 있지만 복잡한 데이터 분석 및 처리에는 라이브러리 pandas가 더 강력합니다. 데이터 처리를 결합 openpyxl및 pandas수행하고 처리된 데이터를 다시 Excel 파일로 저장할 수 있습니다.

`pandas`3.1 Excel 파일을 읽는 데 사용

pandasExcel 데이터를 읽는 작업을 단순화하는 데 사용할 수 있습니다 .

import pandas as pd

# 使用pandas读取Excel文件
df = pd.read_excel('data.xlsx')

# 显示数据
print(df)

pandas이 방법은 read_excel매우 편리하게 Excel 파일을 읽고 그 안에 데이터를 저장할 수 있습니다. 다양한 데이터 처리 및 분석에 적합한 매우 유연한 데이터 구조입니다 DataFrame.DataFrame

3.2 데이터 분석 및 처리

를 사용하면 pandas데이터의 통계적 분석을 쉽게 수행할 수 있습니다. 예를 들어, 각 부서의 평균 출석률을 계산합니다.

# 添加出勤率列
df['出勤率'] = df['出勤天数'] / df['总天数