python基础知识笔记,python自学笔记

  python基础知识笔记,python自学笔记

  # -*-编码:utf-8 -*-

  #1.概念:交叉分析,通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式对变量之间的关系进行对比分析;

  #交叉可以有三种情况:定量和定量分组交叉;定量与定性分组交叉;与定性分组交叉

  #建议相交维度为二维。维度越多越细,越难发现规律。

  #2,交叉计数功能:

  #pivot_table(值,索引,列,聚集函数,填充值)

  #参数描述:

  #values:数据透视表中的值(pivot_table返回的表)

  #index:数据透视表中的行(包含分组行的列数组,即数据透视表中的行)

  #columns:数据透视表中的列(按列分组的列数组,即数据透视表中的列)

  #aggfunc:统计函数(即数据表中统计列(由值指定的列)的统计函数。常用的统计函数有计数、求和等。之前学过)

  # fill _ value:na值的统一替换

  #如需更详细的解释,请参阅http://python.jobbole.com/81212/.

  进口数量

  进口熊猫

  data=pandas . read _ CSV( D:/work spaces/python/python study/27 . CSV )

  #27.csv包括栏目:用户ID、注册日期、身份证号、性别、出生日期、年龄。下载地址:https://pan.baidu.com/s/1x38c4wFe-qRSn9yLC93iHQ

  bin=[最小(数据。年龄)-1,20,30,40,最大(数据。年龄)1]

  标签=[20岁及以下, 21至30岁, 31至40岁, 41岁以上]

  Data[年龄分层]=pandas.cut(data。年龄、垃圾箱、标签=标签)

  ptResult=data.pivot_table(

  Values=[ age],

  Index=[年龄分层],

  Columns=[ gender],

  aggfunc=[numpy.size]

  )

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: