Python交叉表,python中的交集并集

  Python交叉表,python中的交集并集

  交叉分析通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式对变量之间的关系进行对比分析;

  从数据的不同维度对数据进行综合分组和细分,进一步了解数据的构成和分布特征。

  交叉计数功能:

  pivot_table(值,索引,列,聚集函数,填充值)

  参数描述:

  值:数据透视表中的值

  索引:数据透视表中的行

  列:数据透视表中的列

  Aggfunc:统计函数

  fill _ value:na值的相同替换

  #相当于excel中的数据透视表函数

  import numpy import pandas data=pandas . read _ CSV( c:/users/ZL/desktop/python/5.4/data . CSV )bin=[min(data。年龄)-1,20,30,40,最大(数据。年龄)1]标签=[20及以下, 21至30 , 31至40 , 41岁以上]数据[年龄分层]=pandas.cut(数据。age,bin,Labels=Labels)pt result=data . pivot _ table(values=[ Age ],index=[ age hierarchy ],columns=[ gender],Aggfunc=[numpy.size]) out [2]:大小年龄性别男女年龄分层20岁及以下111 195021至30岁2903 4395531至40岁735 799441岁及以上567 886

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: