最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
基于Python实现对比Exce的工具代码示例
时间:2022-06-25 01:17:42 编辑:袖梨 来源:一聚教程网
本篇文章小编给大家分享一下基于Python实现对比Exce的工具代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看。
1.参数
同一个excel文件两个sheet页其中一个ODS(老数据),一个DWH(新数据)
生成对比文件
设计两个主键 输入主键1 输入主键2
(默认新旧文件列名一致)
2.效果
生成的文件
数据量一样、取每个字段不一致的数据前10
数据量不一样、取两边不一样的数据前10、排除不一样的数据、每个字段不一致的数据前10
3.实现
循环对比组合列(主键+对比列)
pandas处理差异数据、openpyxl 处理生成的sheet的数据格式. (先生成数据,然后调整格式)
配置
import pandas as pd from openpyxl import load_workbook #选择文件路径 path=r"C:Users小管同学DesktopMigration_Data_Compari对比文件.xls" #input("选择文件路径:") TargetPath=r"C:Users小管同学DesktopMigration_Data_Comparison_Tool目标文件对比结果.xlsx" DATA_ODS=pd.read_excel(r"C:Users小管同学DesktopMigration_Data_Comparison_Tool对比文件.xls",sheet_name="ODS") DATA_DWH=pd.read_excel(r"C:Users小管同学DesktopMigration_Data_Comparison_Tool对比文件.xls",sheet_name="DWH") #选择主键 Primarykey="员工编号"#input("选择主键1:") Primarykey # 员工编号
一、数据量
输出表格1–数据量
def write_to_excel_DataVolume(Data,TargetPath): # cor_df 为要保存的 dataframe writer = pd.ExcelWriter(TargetPath, engine='xlsxwriter') # 这里用 Data.to_excel(writer,sheet_name='Sheet1', encoding='utf8', header=False, startcol=0, startrow=2) # 把dataframe的数据从第2行开始 workbook = writer.book format1 = workbook.add_format({ # 先把样式打包,然后之后赋值即可 'bold': True, # 字体加粗 'text_wrap': True, # 是否自动换行 'valign': 'bottom', #垂直对齐方式 'align': 'center', # 水平对齐方式 'fg_color': '#C5D9F1', # 单元格背景颜色 'border': 1,# 边框 }) writer_sheet = writer.sheets['Sheet1'] # 设置宽度 writer_sheet.set_column("A:I", 16) writer_sheet.set_column('C:C',30) writer_sheet.merge_range(0,0,0,2,'对比结果',format1) writer_sheet.merge_range(4,2,4,0,'数据量差异',format1) writer_sheet.write(1,0,'',format1) writer_sheet.write(1,1,'ODS',format1) writer_sheet.write(1,2,'DWH',format1) writer.save() writer.close() DataFrame_DataVolume=pd.DataFrame([[DATA_ODS.shape[0]],[DATA_DWH.shape[0]]]).T DataFrame_DataVolume.columns =["ODS","DWH"] DataFrame_DataVolume.index=["数据量"] DataFrame_DataVolume #writeFileDataVolume(DataFrame_DataVolume,TargetPath) write_to_excel_DataVolume(DataFrame_DataVolume,TargetPath)
输出表格2–数据量差异合同
if DATA_ODS.shape[0]==DATA_DWH.shape[0]: pass else: DATA_ODS_Primarykey=pd.DataFrame(DATA_ODS[Primarykey]) DATA_DWH_Primarykey=pd.DataFrame(DATA_DWH[Primarykey]) df_union = pd.concat([DATA_ODS_Primarykey,DATA_DWH_Primarykey]) # 实现1 df_diff_ODS = df_union.append(DATA_ODS_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False) df_diff_DWH = df_union.append(DATA_DWH_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False) #DWH多的合同 df_diff_ODS #DWH少的合同 df_diff_DWH df_diff_DWH_Data=[] df_diff_ODS_Data=[] for i in df_diff_ODS.head(10).values.tolist(): for n in i: df_diff_ODS_Data.append(n) for i in df_diff_DWH.head(10).values.tolist(): df_diff_DWH_Data.append(n) while True: if len(df_diff_DWH_Data)>len(df_diff_ODS_Data): df_diff_ODS_Data.append("-") elif len(df_diff_DWH_Data)
相关文章
- 无限暖暖神秘作者任务怎么做 神秘作者任务流程攻略 09-18
- 如鸢董奉怎么玩 董奉玩法攻略 09-18
- 嘟嘟脸恶作剧活泼队怎么搭配 活泼队搭配推荐 09-18
- 如鸢曹植值得抽吗 曹植抽取建议 09-18
- 如鸢主线9-13王允低练度怎么过 主线9-13王允低练度过关攻略 09-18
- 嘟嘟脸恶作剧薇尔薇特角色如何 09-18