pandas按列合并数据,python pandas dataframe 合并
数据整理是数据处理过程中的一个必要环节。熊猫作为数据分析的利器,提供了五种常用的数据整理方法。让我们看看如何使用这些方法!
目录
join索引一致索引不一致mergeconcat垂直拼接水平拼接appendcombine前几天在一个群里看到一个朋友,在聊他的阿里访谈时被问到熊猫的用法。其中一个问题是:pandas中合并数据的5中方法.
今天,我想借此机会盘点一下熊猫中结合数据的五个函数。但是对于每一个功能,我这里就不详细解释了。具体用法请参考熊猫官方文档。
join主要用于基于索引的横向整合拼接;merge主要用于基于指定列的横向集成拼接;concat可用于水平和垂直合并和拼接;append主要用于垂直加法;combine可以使用函数合并两个列中的数据帧。
join
连接是基于索引的水平拼接。如果索引一致,直接水平连接。如果索引不一致,它们将用Nan值填充。
索引一致
x=pd。DataFrame({A: [A0 , A1 , A2],
B: [B0 , B1 , B2]},
index=[0,1,2])
y=pd。DataFrame({C: [C0 , C2 , C3],
D: [D0 , D2 , D3]},
index=[0,1,2])
x .加入(y)
结果如下:
索引不一致
x=pd。DataFrame({A: [A0 , A1 , A2],
B: [B0 , B1 , B2]},
index=[0,1,2])
y=pd。DataFrame({C: [C0 , C2 , C3],
D: [D0 , D2 , D3]},
index=[1,2,3])
x .加入(y)
结果如下:
merge
合并是基于指定列的水平拼接。该函数类似于关系数据库的连接方式,可以根据一个或多个键连接不同的DatFrame。该功能的典型应用场景是将同一个主键有不同字段的两个表按照主键整合成一个表。
可以指定不同的how参数来表示连接方式,包括内内连接、左左连接、右右连接和外全连接,默认为内;
X=pd。DataFrame({ name 3360 [张三,李四,王五],
类别 3360 [类别1 ,类别2 ,类别3]})
Y=pd。DataFrame({ 专业 3360 [统计学,计算机,绘画],
类别 3360 [类别1 ,类别3 ,类别4]})
pd.merge(x,y,how=left )
结果如下:
concat
Concat功能可用于水平和垂直拼接。
纵向拼接
x=pd。DataFrame([杰克, M ,40],[托尼, M ,20]],columns=[姓名,性别,年龄])
y=pd。data frame([ Mary , F ,30],[Bob , M ,25]],columns=[name , gender , age])
z=pd.concat([x,y],轴=0)
z
结果如下:
横向拼接
X=pd。DataFrame({ name 3360 [张三,李四,王五],
类别 3360 [类别1 ,类别2 ,类别3]})
Y=pd。DataFrame({ 专业 3360 [统计学,计算机,绘画],
类别 3360 [类别1 ,类别3 ,类别4]})
z=pd.concat([x,y],轴=1)
z
结果如下:
append
Append主要用于垂直追加数据。
x=pd。DataFrame([杰克, M ,40],[托尼, M ,20]],columns=[姓名,性别,年龄])
y=pd。data frame([ Mary , F ,30],[Bob , M ,25]],columns=[name , gender , age])
x .追加(y)
结果如下:
combine
通过使用函数,组合可以将两个数据帧组合成列。
x=pd。DataFrame({A:[3,4], B:[1,4]})
y=pd。DataFrame({A:[1,2], B:[5,6]})
x.combine(y,lambda a,b:np.where(ab,a,b))
结果如下:
注意:以上函数用于返回相应位置的最大值。
关于Python Pandas中使用五个函数合并数据的详细解释,本文到此结束。有关Python Pandas中合并数据的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。