Python automatisiertes Büro: der gesamte Prozess von Excel bis zur PDF-Generierung

Erschließen Sie die unendlichen Möglichkeiten der Python-Programmierung: „Wonderful Python“ entführt Sie in die Welt des Codes

In der modernen Büroumgebung sind Datenverarbeitung und Berichterstellung ein sehr wichtiger Bestandteil der täglichen Arbeit. Als flexible und leistungsstarke Programmiersprache kann Python durch eine Reihe von Open-Source-Bibliotheken die Büroautomatisierung realisieren. In diesem Artikel wird ausführlich erläutert, wie Sie mit Python den automatisierten Prozess von der Excel-Datenverarbeitung bis zur Erstellung von PDF-Berichten realisieren können. Zu den behandelten Bibliotheken openpyxlgehören pandasusw.reportlab

Anhand eines Beispielprojekts zeigen wir, wie man Daten aus Excel ausliest, die Daten verarbeitet, Datenberichte generiert und schließlich in Form von PDF ausgibt. Dieser automatisierte Büroprozess kann die Effizienz erheblich verbessern und sich wiederholende Arbeiten reduzieren.

1. Umweltvorbereitung

Stellen Sie vor dem Start sicher, dass die entsprechenden Python-Bibliotheken installiert sind. Wir werden die folgenden Bibliotheken verwenden:

openpyxl : Wird zum Verarbeiten von Excel-Dateien verwendet.
Pandas : werden zur Datenanalyse und -verarbeitung verwendet.
reportlab : Wird zum Generieren von PDF-Dateien verwendet.

Sie können diese Bibliotheken mit dem folgenden Befehl installieren:

pip install openpyxl pandas reportlab

2. Excel-Dateien nutzen `openpyxl`und verarbeiten

openpyxlIst eine häufig verwendete Bibliothek in Python zum Lesen und Schreiben von Excel-Dateien. Wir zeigen zunächst, wie man Daten aus einer Excel-Datei liest und eine einfache Verarbeitung durchführt.

2.1 Excel-Dateien lesen

Angenommen, wir haben eine Excel-Datei data.xlsxmit Anwesenheitsdaten der Mitarbeiter. Die Tabellenstruktur ist wie folgt:

Name	Abteilung	Anzahl der Anwesenheitstage	Abwesenheitstage	Gesamtzahl der Tage
Zhang San	Personalabteilung	20	2	22
John Doe	Finanzabteilung	18	4	22
Wang Wu	Technologieabteilung	22	0	22
Zhao Liu	Marketingabteilung	19	3	22

Zuerst openpyxllesen wir die Daten in Excel mit:

import openpyxl

# 打开Excel文件
workbook = openpyxl.load_workbook('data.xlsx')

# 选择工作表
sheet = workbook.active

# 读取表格数据
data = []
for row in sheet.iter_rows(min_row=2, values_only=True):
    data.append(row)

# 打印读取的数据
for row in data:
    print(row)

Der obige Code liest die Daten jeder Zeile aus Excel und speichert sie in dataeiner Liste. iter_rowsDie Methode kann Daten Zeile für Zeile lesen. Hier stellen wir ein min_row=2, dass der Header übersprungen wird.

2.2 Verarbeitung von Excel-Daten

Wir können die ausgelesenen Daten verarbeiten, z. B. um die gesamten Anwesenheitstage für jede Abteilung zu berechnen. Nehmen wir an, wir möchten Statistiken basierend auf den Anwesenheitstagen erstellen.

from collections import defaultdict

# 统计每个部门的总出勤天数
attendance_summary = defaultdict(int)
for row in data:
    department = row[1]
    attendance_days = row[2]
    attendance_summary[department] += attendance_days

# 打印统计结果
for department, total_days in attendance_summary.items():
    print(f"{
     
      
      department}总出勤天数: {
     
      
      total_days}")

Dieses Code-Snippet gibt die Gesamtanwesenheitstage für jede Abteilung aus.

3. Nutzung `pandas`zur Datenverarbeitung

Während openpyxlExcel-Dateien gelesen und geschrieben werden können, ist die Bibliothek für komplexe Datenanalysen und -verarbeitungen pandasleistungsfähiger. Wir können die Daten zusammenführen openpyxl, pandasverarbeiten und die verarbeiteten Daten wieder in einer Excel-Datei speichern.

3.1 Zum `pandas`Lesen von Excel-Dateien verwenden

Wir können Folgendes verwenden, pandasum das Lesen von Excel-Daten zu vereinfachen:

import pandas as pd

# 使用pandas读取Excel文件
df = pd.read_excel('data.xlsx')

# 显示数据
print(df)

pandasDie Methode read_excelkann Excel-Dateien sehr komfortabel lesen und Daten darin speichern. DataFrameEs DataFramehandelt sich um eine sehr flexible Datenstruktur, die für verschiedene Datenverarbeitungen und -analysen geeignet ist.

3.2 Datenanalyse und -verarbeitung

Mit pandaskönnen wir problemlos statistische Datenanalysen durchführen. Berechnen Sie beispielsweise die durchschnittliche Anwesenheitsquote für jede Abteilung:

# 添加出勤率列
df['出勤率'] = df['出勤天数'] / df['总天数