pandas分组汇总,python数据分组聚合
importpandasaspddf=PD。数据框({ 国家:[中国,中国,印度,印度, ameremeratid)
年龄国家收入05000中国1000014321中国1000021234印度500034010印度50024250美国400064500中国800074321印度
组合单列组合df_GB=df.groupby(国家)(对于index,data indf _ GB:print(index)print(data))。将美国国家收入4250美国40000中国国家收入05000中国1000014321中国1000064500中国8000印度国家收入直径500274321印度5000日本国家收入5250日本50000多列组df_GB=df.groupby([country , incountry , in country,]数据indf _ GB:打印(索引1,索引2 ) ) (打印)数据)输出(美国,40000)年龄国家收入465250美国)(美国)10000)年龄国家收入05000中国1000014321中国10000(印度),5000)年龄国家收入21234印度500074321印度5000 (ia
默认情况下,分组后的其他列将被聚合
df_AgG=df.groupby(国家)。agg ("min "," mean "," max "," print (df _ agg)))。美国,中国,日本,53680 .68686868669有时会对分组后的子串进行聚合,只需要对部分数据进行不同的聚合操作,可以用字典构建
num_agg={Age:[min , mean , max } print(df . group by) country].数量_数量) )输出阿奇明迈克斯countrymama美国公司56867.88868888661中国43214607.0000005000印度12343188.3333334321日本250250.000000000250 num _ agg=0 Income :[ min , max }打印(df.group by)"国家")。agg)(num _ agg))ageincomeminmeanmaxminmaxcountrymamamerica 25001。086686866066
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。