python 多张表合并,python链表合并
使用pandas和openpyxl合并两个或多个excel,并删除重复项;具体编码和解释如下:
#用熊猫实现类似vlookup的功能来实现两个表的合并。注意:只可能有对应的列表,比如两个表都有学号;
进口熊猫作为pd
导入openpyxl # pip安装openpyxl
#从Excel文件加载数据集
Df_1=pd.read_excel(E:/上架菌株测序结果_新老99和潜在新种整合结果/试管测序结果20200927.xlsx )
打印(df_1)
Df_2=pd.read_excel(E:/上架菌株测序结果_新老99和潜在新物种整合结果/1.xlsx )
打印(df_2)
# df _ 3=PD . read _ excel( sheet 3 . xlsx )
#合并数据集
Df _ combine=df _ 1.merge (df _ 2,left _ on=客户编号,right_on=编号)
# df _ combine=df _ combine . merge(df _ 3,on=PolicyID )
打印(df_combine)
#输出回Excel
df _ combine=df _ combine . drop(columns= number )#删除一列
print(df _ combine . drop _ duplicates())
Df_combine.to_excel(E:/上架菌株测序结果_新老99和潜在新物种整合结果/df _ combine1.xlsx ,sheet _ name= combined )
这是第一张表:
image.png
这是第二张表:
image.png
我们的目标是合并,其中方法类似于vlookup,
所以首先合并,然后删除重复的数字和其中一个客户编号列,您将得到以下结果:
image.png
代码的运行结果是:
image.png
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。