Python交叉表,python中的交集并集
交叉分析通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式对变量之间的关系进行对比分析;
从数据的不同维度对数据进行综合分组和细分,进一步了解数据的构成和分布特征。
交叉计数功能:
pivot_table(值,索引,列,聚集函数,填充值)
参数描述:
值:数据透视表中的值
索引:数据透视表中的行
列:数据透视表中的列
Aggfunc:统计函数
fill _ value:na值的相同替换
#相当于excel中的数据透视表函数
import numpy import pandas data=pandas . read _ CSV( c:/users/ZL/desktop/python/5.4/data . CSV )bin=[min(data。年龄)-1,20,30,40,最大(数据。年龄)1]标签=[20及以下, 21至30 , 31至40 , 41岁以上]数据[年龄分层]=pandas.cut(数据。age,bin,Labels=Labels)pt result=data . pivot _ table(values=[ Age ],index=[ age hierarchy ],columns=[ gender],Aggfunc=[numpy.size]) out [2]:大小年龄性别男女年龄分层20岁及以下111 195021至30岁2903 4395531至40岁735 799441岁及以上567 886
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。