实现Excel里每个sheet的排序并整合在一个sheet里

针对一个excel文件中多个sheet的批处理，excel的选定全部工作表功能可以解决很多问题（如：转置、替换等），但是对于排序确难以实现。因此在这里使用python工具来实现批量排序。

最终目的是实现对每个sheet文件排序后，将所有sheet拼接在一个sheet中。
最初打算先批量排序，然后在实现拼接。

但是在运行批量排序的代码中发现sheet发生覆盖，虽然网上有避免覆盖的方法，但是不适用于这里。这里先介绍该方法。

https://blog.csdn.net/qq_39697564/article/details/88640686

# 1. 基本模块的导入
import numpy as np
import pandas as pd

# 2. 创建不同的写入数据
DF_1 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('AB'))
DF_2 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('CD'))+1
DF_3 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('EF'))+2
DF_4 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('GH'))+3

# 3. 数据写出
with pd.ExcelWriter(r'C:\Users\Desktop\ExcelTest\DF_All.xlsx') as writer:
    DF_1.to_excel(writer,sheet_name='DF_1')
    DF_2.to_excel(writer,sheet_name='DF_2')
    DF_3.to_excel(writer,sheet_name='DF_3')
    DF_4.to_excel(writer,sheet_name='DF_4')
writer.save()
writer.close()
print('Finished.')

由上述代码也可以看出这里的每一个将要分别写入excel的数据框是独立的。但是我是想从一个excel中的多的sheet提取，然后处理后再次写入excel。

# -*- coding: UTF-8 -*-
#导入所需模块
import xlrd
import numpy as np
import pandas as pd
from  pandas import DataFrame
from openpyxl import load_workbook

excel_name = r'C:\4_stepSHIYAN\shiyan222.xlsx'  #表格地址+表格名
wb = xlrd.open_workbook(excel_name)  # 获取workbook中所有的表格
sheets = wb.sheet_names()
print (sheets)

# 循环遍历所有sheet
#alldata = DataFrame()
for i in range(len(sheets)):
      df = pd.read_excel(excel_name, sheet_name=i, index=False, encoding='utf8')
      df.sort_values("POINTID", ascending=True, inplace=True)
      print (df)  #查看dataframe
   ###保存为新的sheet,首先新建sheet
      with pd.ExcelWriter(r'C:\4_stepSHIYAN\new.xlsx' ,engin='openpyxl') as writer :
            for j in range(3):
                  name = "sheet"+ str(j)
                  df.to_excel(writer,sheet_name= name )
     
print ('处理完成！')


##########上述代码跑到第二个for语句时，实际只是对于i内容的两次存储。并没真正实现i1、i的单独存储

未解决疑问——如何实现从excel里读取出来的多个sheet处理后再次写入另一个excel的多个sheet？？？

但是对于自己的最终目标，可以直接将处理完的sheet拼接起来后再写入一个sheet中！！

# -*- coding: UTF-8 -*-
#导入所需模块
import xlrd
import pandas as pd
from  pandas import DataFrame
from openpyxl import load_workbook

excel_name =  r'C:\4_stepSHIYAN\shiyan222.xlsx'   #表格地址+表格名
wb = xlrd.open_workbook(excel_name)  # 获取workbook中所有的表格
sheets = wb.sheet_names()
print (sheets)

# 循环遍历所有sheet
alldata = DataFrame()
for i in range(len(sheets)):
    df = pd.read_excel(excel_name, sheet_name=i, index=False, encoding='utf8')
    df.sort_values("POINTID", ascending=True, inplace=True)  #对sheet内容按照第一列-POINTID-排序、inplace=True 将排序之后的数据直接替换原来的数据框（默认为False,False时，那么原来顺序没变，只是返回的是排序的）、ascending=True默认True升序排列；False降序排列
    alldata = alldata.append(df)  ##拼接
#查看dataframe
#print alldata

#保存为新的sheet,首先新建sheet,合并后的数据保存到新sheet中
writer = pd.ExcelWriter( r'C:\4_stepSHIYAN\shiyan222.xlsx' ,engin='openpyxl')
book = load_workbook(writer.path)  ####作用？
writer.book = book

#利用dataframe.to_excel保存合并后的数据到新的sheet
alldata.to_excel(excel_writer=writer,sheet_name="ALLDATA")#生成新的sheet命名为ALLDATA
writer.save()
writer.close()
print ('处理完成！')

UCAS_Leon124

发布了25 篇原创文章 · 获赞 7 · 访问量 2798

私信关注

实现Excel里每个sheet的排序并整合在一个sheet里

未解决疑问——如何实现从excel里读取出来的多个sheet处理后再次写入另一个excel的多个sheet？？？

猜你喜欢